漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-10 talkingdev

AI自主攻克数学难题:陶哲轩证实埃尔德什问题#728首次由人工智能基本独立解决

近日,数学界迎来一项里程碑式进展:著名数学家陶哲轩在其社交账户上宣布,埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献,而是在埃尔德什问题网站社区重构问题...

Read More
2025-11-29 talkingdev

Prime Intellect发布INTELLECT-3:1060亿参数开源MOE模型在数学代码科学领域超越更大模型

人工智能公司Prime Intellect正式推出INTELLECT-3模型,这是一个基于强化学习训练、具备1060亿参数的混合专家开源模型。该模型采用创新的MoE架构,通过动态激活专家网络显著提升计算效率,在数学推理、代码生成、科...

Read More
2025-11-29 talkingdev

DeepSeekMath-V2模型在IMO 2025与中国奥数2024斩获金牌级表现

中国AI初创公司深度求索(DeepSeek)最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛(IMO)2025及中国数学奥林匹克2024中达到金牌级水平,标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...

Read More
2025-11-28 talkingdev

开源|DeepSeekMath-V2:迈向可自我验证的数学推理新突破

深度求索公司最新发布的DeepSeekMath-V2研究论文在GitHub平台引发广泛关注,该研究标志着数学推理AI模型向自我验证能力迈出了重要一步。这项前沿技术通过引入自我验证机制,使模型能够自动检查数学推导过程的正确性...

Read More
2025-11-11 talkingdev

Moonshot AI开源Kimi K2思维模型:320亿激活参数,性能达非思维模型前沿水平

近日,前沿开源实验室Moonshot AI正式发布其新一代Kimi K2思维模型,该模型采用混合专家架构,具备320亿激活参数与1万亿总参数的庞大规模。在技术性能方面,Kimi K2在前沿知识理解、数学推理及代码生成领域均达到当...

Read More
2025-10-08 talkingdev

论文推荐|Less is More:微型网络实现递归推理

三星蒙特利尔AI实验室最新研究《Less is More: Recursive Reasoning with Tiny Networks》提出突破性方法,通过递归架构使参数量极少的神经网络具备复杂推理能力。该研究在arXiv公开的论文(编号2510.04871)中展示...

Read More
2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型:200K上下文窗口,宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page