数学推理的相关内容 - 漫话开发者

2026-05-26 talkingdev

每道只花几百美元！谷歌DeepMind AlphaProof 攻克数十年未解数学难题

谷歌DeepMind团队推出新系统AlphaProof Nexus，在未依赖公开发表或训练集中可见的标准解法的情况下，自主解决了353个公开埃尔德什（Erdős）问题中的9道，其中有两道难题甚至困扰了数学界56年之久。值得一提的是，每...

2026-05-21 talkingdev

OpenAI的一个推理模型成功推翻了离散几何学中的核心猜想——“平面单位距离问题”（Planar Unit Distance Problem）。该猜想最早由20世纪著名数学家保罗·埃尔德什于1946年提出，在长达80年的时间里一直未被攻克，是离散...

2026-03-24 talkingdev

人工智能研究机构Epoch近日发布报告，确认其最新模型GPT-5.4 Pro成功解决了一个长期悬而未决的前沿数学开放问题——超图上的拉姆齐风格问题。该问题属于组合数学的核心领域，要求构造尽可能大的超图，使其不具备某个易...

2026-02-23 talkingdev

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战，旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

2026-01-26 talkingdev

近日，一个名为TTT-Discover的开源项目在GitHub上发布，其核心创新在于将强化学习（Reinforcement Learning）技术应用于大型语言模型（LLMs）的推理（Inference）阶段，而非传统的训练阶段。这一“测试时训练”（Test-...

2026-01-10 talkingdev

近日，数学界迎来一项里程碑式进展：著名数学家陶哲轩在其社交账户上宣布，埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献，而是在埃尔德什问题网站社区重构问题...

2025-11-29 talkingdev

人工智能公司Prime Intellect正式推出INTELLECT-3模型，这是一个基于强化学习训练、具备1060亿参数的混合专家开源模型。该模型采用创新的MoE架构，通过动态激活专家网络显著提升计算效率，在数学推理、代码生成、科...

2025-11-29 talkingdev

中国AI初创公司深度求索（DeepSeek）最新发布的DeepSeekMath-V2数学模型在国际数学奥林匹克竞赛（IMO）2025及中国数学奥林匹克2024中达到金牌级水平，标志着AI在复杂数学推理领域的重大突破。该模型通过创新的推理架...