语言模型的相关内容 - 漫话开发者

2026-05-06 talkingdev

论文推荐|Google重新定义AI幻觉：从“知识缺陷”转向“不确定性表达”

谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出，大语言模型（LLM）产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误，而是模型在输出时未能有效表达其内在的不确定性。研究提...

2026-05-06 talkingdev

近日，一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理，为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...

2026-05-06 talkingdev

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日，初创公司Subquadratic宣布推出一款全新的AI模型，其上下文窗口达到了惊人的1200万token（约合1200万个单词或代码标记），远超过当前主流模...

2026-05-06 talkingdev

OpenAI近日正式推出GPT-5.5 Instant，并已将其部署为ChatGPT的默认模型。这一更新并非单纯的参数规模提升，而是针对模型在实际应用中的关键痛点进行了重大优化。首先，新版模型在事实准确性上实现了显著飞跃，通过改...

2026-05-04 talkingdev

随着AI Agent在复杂任务中的广泛应用，其核心控制机制——Agent Harness的架构设计正成为影响安全性和多用户协作效率的关键因素。Agent Harness本质上是驱动大语言模型（LLM）的控制循环，负责与外部环境交互、管理凭...

2026-05-04 talkingdev

在大型语言模型（LLM）和视觉语言模型（VLM）部署中，模型量化是降低计算和存储成本的关键技术。然而，传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍，尤其是在超低位宽（如2-bit、3-bit）下，精度损失...

2026-05-01 talkingdev

OpenAI在一项最新研究中揭示了GPT-5.1模型一个有趣的行为现象：随着使用频率增加，模型在生成文本时越来越倾向于使用“哥布林”（goblin）风格的隐喻表达。研究表明，这一“哥布林怪癖”并非模型随机涌现的幻觉，而是直...

2026-04-30 talkingdev

苹果机器学习研究团队提出了一种名为LaDiR（Latent Diffusion Reasoner）的创新推理框架，为大型语言模型（LLM）的文本推理能力带来了显著提升。LaDiR框架的核心在于巧妙地将连续潜在表示的强大表现力与潜在扩散模型...