漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-06 talkingdev

OpenAI发布GPT-5.5 Instant:默认模型迎来事实准确性、幻觉抑制与个性化定制三重升级

OpenAI近日正式推出GPT-5.5 Instant,并已将其部署为ChatGPT的默认模型。这一更新并非单纯的参数规模提升,而是针对模型在实际应用中的关键痛点进行了重大优化。首先,新版模型在事实准确性上实现了显著飞跃,通过改...

Read More
2026-05-05 talkingdev

OpenAI披露低延迟语音AI全球架构:WebRTC分体中继与收发器模型成关键

OpenAI近日详细披露了其用于全球规模实时语音交互的低延迟基础设施架构。该架构基于重新设计的WebRTC协议,核心采用了分体中继(split relay)和收发器(transceiver)模型。通过将传统WebRTC的单一媒体传输路径拆解...

Read More
2026-05-05 talkingdev

一夜格式化2500万行代码:Stripe开源Rubyfmt工具的故事

支付巨头Stripe在官方技术博客中分享了一则引人注目的工程案例:他们使用自研的代码格式化工具Rubyfmt,在一夜之间将内部庞大的2500万行Ruby代码库全面格式化。这项工作不仅展示了自动化代码格式化在大型项目中的巨...

Read More
2026-05-04 talkingdev

开源|AutoRound:10分钟单GPU搞定7B大模型量化,极致压缩精度不减

在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...

Read More
2026-05-04 talkingdev

OpenAI为Codex新增动画宠物与配置导入功能:桌面编程助手更具亲和力

OpenAI近日为其编程助手Codex推出了一系列旨在提升用户体验与实用性的更新。最引人注目的变化是引入了“动画宠物”功能,这些虚拟宠物会以屏幕浮层的形式出现,并通过简短的气泡消息与用户进行互动。这一设计不仅赋予...

Read More
2026-05-04 talkingdev

开源|DeepClaude — 融合DeepSeek V4 Pro与Claude Code的AI代理循环,成本降低17倍

在AI大模型应用领域,成本与性能的平衡一直是开发者关注的焦点。近日,一款名为DeepClaude的开源工具在开发者社区引发热议。该项目巧妙地将DeepSeek V4 Pro模型与Claude Code的代理循环(Agent Loop)进行结合,旨在...

Read More
2026-05-01 talkingdev

DuckDB 实现全文搜索:轻量级数据库的新突破

DuckDB,作为一款高性能的嵌入式数据库,近年来在数据分析领域备受关注。近日,一篇技术博客详细介绍了如何在 DuckDB 中实现全文搜索功能。该文章不仅提供了详细的技术实现步骤,还探讨了该功能对轻量级数据库应用场...

Read More
2026-04-30 talkingdev

DeepSpeed整合AutoSP:自动序列并行技术,轻松训练超长上下文LLM

PyTorch官方博客近日发布了一项名为AutoSP的创新技术,该技术旨在自动化地将标准Transformer训练代码转换为序列并行代码,用于长上下文大语言模型(LLM)的训练。AutoSP已与微软的DeepSpeed框架深度集成,使得开发者...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page