漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-23 talkingdev

揭秘OpenAI:如何扩展PostgreSQL以支撑8亿ChatGPT用户

OpenAI近日分享了其扩展PostgreSQL数据库以支撑ChatGPT海量用户的技术实践。面对数亿用户的并发访问和庞大的数据规模,传统单实例PostgreSQL已无法满足需求。OpenAI技术团队通过实施一系列高级扩展策略,成功构建了...

Read More
2026-01-16 talkingdev

开源|JuiceFS:基于Redis与S3构建的分布式POSIX文件系统引热议

近日,开源项目JuiceFS在技术社区引发广泛关注。该项目是一个基于Redis和对象存储(如Amazon S3)构建的分布式POSIX文件系统,旨在为云原生环境提供高性能、高可靠且与POSIX标准兼容的共享文件存储解决方案。其核心...

Read More
2026-01-08 talkingdev

开源|Hugging Face发布FinePDFs:从PDF中解放3万亿高质量训练令牌

在开源人工智能社区中,PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日,Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs,成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...

Read More
2025-12-24 talkingdev

开源|Miller:专为命名索引数据设计的命令行瑞士军刀,高效处理CSV/JSON等大数据

在数据科学与工程领域,高效处理结构化数据是提升工作效率的关键。近日,一款名为Miller的开源命令行工具因其在处理命名索引数据格式方面的卓越能力而受到开发者社区的关注。Miller专门针对CSV、TSV、JSON及JSONL等...

Read More
2025-12-13 talkingdev

苹果macOS 26.2重磅更新:通过Thunderbolt实现RDMA,赋能高速AI计算集群

苹果近日在开发者文档中正式发布了macOS 26.2(代号Tahoe)的更新说明,其中一项关键特性引发了高性能计算与人工智能领域的广泛关注:系统原生支持通过Thunderbolt接口实现远程直接内存访问(RDMA)。这项技术突破意...

Read More
2025-12-11 talkingdev

微软Copilot年度分析:2025年前三季度3750万次对话中,健康咨询成用户最关注话题

根据微软首次向Axios分享的数据分析报告,在2025年1月至9月期间,微软对其人工智能助手Copilot的3750万次用户对话进行了深入分析。研究发现,用户正越来越多地转向Copilot寻求关于个人健康、职业发展和人际关系等方...

Read More
2025-12-01 talkingdev

开源|Exposed by Default:你的浏览器正在泄露多少隐私?

近日,一个名为'Exposed by Default'的开源项目网站引发科技界与隐私安全领域的广泛关注。该网站通过实时检测,直观展示了用户浏览器在未经明确授权的情况下自动暴露的庞大数据量,这些数据共同构成了一个高度独特的...

Read More
2025-11-14 talkingdev

数据湖性能对决:Polars、DuckDB、Daft与Spark处理650GB Delta Lake基准测试

近日,数据工程领域开展了一项重要的性能基准测试,针对当前主流的四大数据处理框架——Polars、DuckDB、Daft和Spark,在亚马逊S3存储的650GB Delta Lake数据集上进行了全面对比。测试聚焦于现代数据架构中的关键性能...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page