中国人工智能实验室月之暗面(Moonshot AI)近日开源其革命性推理模型Kimi K2,在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’(Humanity's Last Exam)中取得44.9%的...
Read More最新技术研究显示,通过模型上下文协议(MCP)实现的代码执行功能正在显著提升AI代理的运行效率。这项突破性技术使AI代理能够在连接多个MCP服务器时,大幅减少令牌消耗,最高可降低98.7%的上下文开销。传统方法中,...
Read MoreAnthropic最新研究通过‘概念注入’实验,首次系统验证了大语言模型的内省能力。研究显示,特别是Claude Opus 4和4.1版本模型能够检测并识别被注入的概念,并能通过参照自身‘意图’来识别意外输出。实验证明这些模型具...
Read More在Universe 2025大会上,GitHub推出了颠覆性的Agent HQ平台,将开发者工作流演进为支持多智能体协同的开放生态系统。该平台通过名为‘任务控制中心’的统一指挥系统,实现了对Anthropic、OpenAI、Google、Cognition、x...
Read MoreAnthropic研究团队在《Circuits Updates – October 2025》中披露了令人振奋的发现:其大型语言模型Claude的内部神经元展现出跨模态理解能力。实验表明,当模型处理文字“眼睛”时激活的特定神经元,在遇到用@符号排列...
Read More近日,GitHub平台上线开源项目Open Notebook,该项目作为谷歌Notebook LM的开源替代方案,在数据自主性与功能扩展性上实现重要突破。该平台允许用户完全掌控个人数据,并集成超过16家主流AI服务提供商(如OpenAI、An...
Read More人工智能安全与研究公司Anthropic正式推出网页版Claude Code测试功能,这项突破性服务允许开发者直接在浏览器中委托AI执行编程任务。该云服务采用沙盒环境下的并行执行架构,可安全连接GitHub代码库并实时追踪任务进...
Read More人工智能安全与研究公司Anthropic正式推出基于浏览器的Claude Code测试版本,标志着AI编程助手进入云端协作新阶段。该平台突破性地支持用户直接连接GitHub仓库,实现跨多个代码库的并行任务处理能力。每个编程会话均...
Read More