OpenAI近日分享了其将PostgreSQL数据库扩展至支撑8亿ChatGPT用户及每秒数百万次查询的技术架构细节。面对以读操作为主的巨大负载,OpenAI团队通过将写密集型操作卸载至Azure Cosmos DB等分片系统,并实施应用层与查...
Read MoreOpenAI近日分享了其扩展PostgreSQL数据库以支撑ChatGPT海量用户的技术实践。面对数亿用户的并发访问和庞大的数据规模,传统单实例PostgreSQL已无法满足需求。OpenAI技术团队通过实施一系列高级扩展策略,成功构建了...
Read More近日,一个名为chunkhound的开源项目在GitHub上发布,为AI驱动的文档处理与检索工作流带来了新的工具选择。该项目是一个完全采用Rust语言编写的AI分块库,其核心功能是将冗长的文档智能地分割成具有语义连贯性的片段...
Read More近日,知名开发者antirez在GitHub上开源了项目“flux2.c”,该项目实现了当前热门的Flux 2图像生成模型的纯C语言推理引擎。这一举措在技术社区引发了广泛关注,在Hacker News上获得了285点热度并积累了112条深度讨论。...
Read More近日,由D2I-ai团队在GitHub上开源的DASD(序列蒸馏)项目,提出了一种创新的模型蒸馏流程,旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术,通过精细化的知...
Read More近日,开源项目JuiceFS在技术社区引发广泛关注。该项目是一个基于Redis和对象存储(如Amazon S3)构建的分布式POSIX文件系统,旨在为云原生环境提供高性能、高可靠且与POSIX标准兼容的共享文件存储解决方案。其核心...
Read MoreDatabricks近日在GitHub上开源了其核心基础设施项目Dicer,这是一个专为构建大规模分片服务而设计的自动分片器。该系统旨在解决传统无状态服务模型在处理有状态工作负载时面临的效率瓶颈。Dicer的核心创新在于通过将...
Read More近日,开源社区迎来一款名为GLM-Image的工业级离散自回归图像生成模型,其采用了一种创新的混合架构,将自回归模块与扩散解码器相结合,标志着生成式AI在图像合成领域的技术路线探索进入新阶段。该模型的核心优势在...
Read More