突破性进展的相关内容 - 漫话开发者

2026-06-12 talkingdev

开源｜小米发布MiMo Code，200步超长任务性能超越Claude Code

小米近日在AI编程助手领域取得了突破性进展，正式开源了其终端原生AI编码工具——MiMo Code V0.1.0。这款工具在关键AI编码基准测试中表现抢眼，特别是在涉及超长周期、多步骤的复杂任务（超过200步）上，性能超越了知...

2026-05-08 talkingdev

谷歌近期在Gemma大型语言模型上实现了令人瞩目的推理速度提升，成功将性能提升了三倍。这一突破性进展的核心在于采用了“投机解码”（Speculative Decoding）技术。该技术的工作原理是部署一个轻量级、速度极快的“草稿...

2026-05-06 talkingdev

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日，初创公司Subquadratic宣布推出一款全新的AI模型，其上下文窗口达到了惊人的1200万token（约合1200万个单词或代码标记），远超过当前主流模...

2026-04-12 talkingdev

加州大学伯克利分校的研究团队近日发表博客文章，详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出，当前许多流行的AI智能体基准测试存在设计缺陷，容易被特定策略“破解”或产生误导性结...

2026-02-09 talkingdev

网络安全与访问管理公司StrongDM近日公开了其创新的“软件工厂”概念，标志着AI代理在软件开发领域向非交互式自主化迈出了关键一步。该工厂的核心在于，AI代理能够根据给定的规格说明和场景描述，完全自主地编写、迭代...

2026-02-09 talkingdev

Cursor公司近日宣布，将其多智能体研究工具的一部分以预览形式向公众开放。这项研究展示了一个突破性进展：数千个AI智能体在极少人工干预的情况下，协同编码并成功构建了一个功能完整的网页浏览器。这一实验不仅验证...

2026-02-07 talkingdev

埃里克·张（Eric Jang）在其个人博客Evjang.com上发表了一篇关于人工智能前沿趋势的深度分析文章。文章以范内瓦·布什博士1945年的经典论述《诚如所思》为引，将现实世界比作一个开放式的多人在线游戏（MMO），并指出...

2026-01-28 talkingdev

艾伦人工智能研究所（AI2）近日正式推出了“开源编码智能体”计划，旨在解决当前封闭且昂贵的编码智能体系统存在的局限性。作为该计划的首个成果，AI2发布了SERA（软验证高效仓库智能体）系列模型及其配套的可访问训练...