漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-06 talkingdev

Anthropic发布Claude Opus 4.6:智能体编码与复杂推理能力再升级

人工智能研究公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大语言模型在专业应用领域的能力边界再次被拓展。该模型在智能体编码、计算机使用、工具调用、信息检索及金...

Read More
2026-02-03 talkingdev

论文推荐|NVIDIA提出“金鹅”方法:从未经验证的网络文本中无限合成RLVR任务,突破大模型强化学习瓶颈

近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...

Read More
2025-12-15 talkingdev

Tinker全面开放并集成视觉输入能力,推理模型Kimi K2 Thinking正式上线

人工智能平台Tinker今日宣布结束等待名单,正式向所有用户开放,并同步推出多项重要技术更新。本次更新的核心亮点包括:引入全新的推理模型Kimi K2 Thinking,该模型拥有万亿级参数,专为处理长链条复杂推理和工具调...

Read More
2025-12-04 talkingdev

英伟达发布性能数据:GB200 Blackwell AI服务器对月之暗面Kimi K2、深度求索R1等MoE模型推理性能提升高达10倍

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据,结果显示,相较于前代H100/H200平台,该服务器在运行特定类型的混合专家模型时,性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

Read More
2025-11-07 talkingdev

开源|月之暗面Kimi K2推理模型:多项基准超越GPT-5与Claude Sonnet 4.5

中国人工智能实验室月之暗面(Moonshot AI)近日开源其革命性推理模型Kimi K2,在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’(Humanity's Last Exam)中取得44.9%的...

Read More
2025-11-07 talkingdev

深度解析月之暗面Kimi K2推理模型:国产MoE架构突破性能边界

中国人工智能实验室月之暗面(Moonshot AI)最新推出的Kimi K2 Thinking模型,以其创新的混合专家(MoE)推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中,部分指标...

Read More
2025-11-05 talkingdev

超越标准大语言模型:线性注意力混合架构与文本扩散模型引领新浪潮

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型,但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升,更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本,在创造...

Read More
2025-10-08 talkingdev

论文推荐|Less is More:微型网络实现递归推理

三星蒙特利尔AI实验室最新研究《Less is More: Recursive Reasoning with Tiny Networks》提出突破性方法,通过递归架构使参数量极少的神经网络具备复杂推理能力。该研究在arXiv公开的论文(编号2510.04871)中展示...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page