数学证明的相关内容 - 漫话开发者

2026-07-17 talkingdev

GPT-5.6 引入 Codex 多模型分工体系：Sol、Terra、Luna 各司其职，Sol Ultra 解锁深度推理与多智能体协同

OpenAI 最新推出的 GPT-5.6 在 Codex 开发环境中首次引入了一套精细化的多模型任务分配机制，将工作负载自动分流至 Sol、Terra 和 Luna 三个特性鲜明的执行单元。其中，Sol 专门应对目标模糊但价值极高的复杂问题，...

2026-06-06 talkingdev

在人工智能顶级会议ICLR 2026上，一篇题为《Transformer are inherently succinct》的论文被评选为三篇杰出论文之一。该研究从理论层面深入论证了Transformer架构在本质上具有简洁性（succinctness），即模型能够在...

2026-05-26 talkingdev

谷歌DeepMind团队推出新系统AlphaProof Nexus，在未依赖公开发表或训练集中可见的标准解法的情况下，自主解决了353个公开埃尔德什（Erdős）问题中的9道，其中有两道难题甚至困扰了数学界56年之久。值得一提的是，每...

2026-05-08 talkingdev

谷歌DeepMind团队近日发布了其最新成果AlphaEvolve，这是一个由Gemini大模型驱动的自主编码代理。与普通的代码助手不同，AlphaEvolve的核心能力在于设计并生成高级算法，而不仅仅是补全或改写现有代码。它已经能够在...

2026-03-13 talkingdev

硅谷初创公司Axiom在成立仅一年、团队约20人规模之际，成功完成了由Menlo Ventures领投的2亿美元A轮融资，估值高达16亿美元。该公司致力于开发名为“Verified AI”的系统，其核心创新在于利用形式化验证技术，确保AI生...

2026-02-23 talkingdev

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战，旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

2026-02-14 talkingdev

近日，一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示，其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果：它独立地提出了一个关于胶子散射振幅的新公...

2026-01-10 talkingdev

近日，数学界迎来一项里程碑式进展：著名数学家陶哲轩在其社交账户上宣布，埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献，而是在埃尔德什问题网站社区重构问题...