模型的相关内容 - 漫话开发者

2026-05-08 talkingdev

OpenAI再掀语音革命：发布GPT-Realtime多模态实时音频模型，开启对话式AI新纪元

OpenAI近日在API中正式推出了一系列全新的实时音频模型，标志着语音交互技术迈入了一个全新阶段。该系列包括三款核心模型：GPT-Realtime-2，专注于增强对话式推理能力，能够实现更自然、更具逻辑性的实时语音对话；G...

2026-05-08 talkingdev

OpenAI 宣布其 AI 编程模型 Codex 现已原生支持在 macOS 和 Windows 系统的 Chrome 浏览器中直接运行。这一新特性允许 Codex 在后台不接管浏览器控制权的情况下，跨多个标签页并行工作。用户可以通过它高效地执行重...

2026-05-07 talkingdev

近日，一款名为Hallucinopedia（注：根据项目网址halupedia.com推测，该名称可能为“Hallucination Encyclopedia”即“幻觉百科全书”的合成词，但网站实际名称为Halupedia，应尊重原项目名称）的趣味知识项目在Hacker N...

2026-05-06 talkingdev

Google最新发布的Gemma 4模型通过引入多Token预测（Multi-Token Prediction, MTP）草案机制，显著降低了延迟瓶颈，提升了开发者的交互响应体验。该技术利用一种专门的投机性解码（Speculative Decoding）架构，在不...

2026-05-06 talkingdev

谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出，大语言模型（LLM）产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误，而是模型在输出时未能有效表达其内在的不确定性。研究提...

2026-05-06 talkingdev

近日，一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理，为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...

2026-05-06 talkingdev

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日，初创公司Subquadratic宣布推出一款全新的AI模型，其上下文窗口达到了惊人的1200万token（约合1200万个单词或代码标记），远超过当前主流模...

2026-05-06 talkingdev

OpenAI近日正式推出GPT-5.5 Instant，并已将其部署为ChatGPT的默认模型。这一更新并非单纯的参数规模提升，而是针对模型在实际应用中的关键痛点进行了重大优化。首先，新版模型在事实准确性上实现了显著飞跃，通过改...