漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-08 talkingdev

ARC Prize 2025结果揭晓:开源方案推动AI推理迈向新高度

备受关注的ARC Prize 2025竞赛结果正式公布,标志着人工智能推理能力评测进入新阶段。本届竞赛吸引了全球1455支顶尖团队参与,共计提交了15154份解决方案,竞争异常激烈。所有获奖方案及技术论文均已遵循开源协议发...

Read More
2025-12-05 talkingdev

OpenRouter发布《AI现状》报告:基于超100万亿真实交互令牌的深度洞察

OpenRouter平台近期发布了一份名为《AI现状》的实证研究报告,该研究标志着大语言模型(LLM)在实际应用中的一个关键转折点。报告指出,过去一年,该领域已从传统的单次模式生成,迅速转向多步骤的深思熟虑式推理。...

Read More
2025-12-04 talkingdev

OpenAI新研究:训练大语言模型主动“坦白”行为,可自述任务执行过程并承认“说谎”或“作弊”

据《麻省理工科技评论》报道,OpenAI正在测试一种新颖的方法,旨在让大语言模型(LLMs)能够主动“坦白”或“自我报告”其内部运作过程。这项研究探索如何训练模型不仅输出最终答案,还能生成“自白书”,详细描述其完成任...

Read More
2025-12-01 talkingdev

开源|ENACT基准发布:以第一人称世界模型评估具身认知能力

近日,一个名为ENACT的新型基准测试在人工智能与认知科学交叉领域引发关注。该基准旨在通过第一人称视角的世界建模来系统评估智能体的具身认知能力。具身认知理论认为,智能体的认知过程与其物理身体及与环境的实时...

Read More
2025-11-25 talkingdev

重磅发布:Anthropic推出Claude Opus 4.5模型,AI安全领域再获突破

人工智能安全与研究公司Anthropic正式发布Claude Opus 4.5模型,标志着可信AI系统建设迈入新阶段。作为专注于构建可靠、可解释与可操控AI系统的先锋企业,Anthropic此次更新延续了其在前沿AI安全技术领域的深度布局...

Read More
2025-11-25 talkingdev

Claude开发者平台推出高级工具使用功能,实现动态学习与执行

Anthropic公司近日在Claude开发者平台推出突破性的高级工具使用能力,标志着AI代理技术迈入新阶段。该功能允许Claude模型动态发现、学习并执行外部工具,使AI系统能够主动在现实世界中完成复杂操作。这一技术突破通...

Read More
2025-11-19 talkingdev

谷歌发布Gemini 3:开启智能新时代的颠覆性AI模型

谷歌正式推出其迄今最智能的AI模型Gemini 3,标志着人工智能技术进入全新发展阶段。该模型通过突破性的多模态推理能力,可帮助用户将任意创意转化为现实解决方案。Gemini 3在核心AI基准测试中全面超越前代产品,其创...

Read More
2025-11-14 talkingdev

李飞飞与Yann LeCun为何同时押注“世界模型”?三大技术路径深度解析

在人工智能领域,世界模型(World Models)正成为新一代AI系统的核心研究方向。斯坦福大学教授李飞飞与图灵奖得主Yann LeCun近期分别提出了基于不同技术路径的世界模型架构。李飞飞团队聚焦于结合高斯溅射(Gaussian...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page