漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-24 talkingdev

AI攻克前沿数学难题:GPT-5.4 Pro成功解决超图拉姆齐问题

人工智能研究机构Epoch近日发布报告,确认其最新模型GPT-5.4 Pro成功解决了一个长期悬而未决的前沿数学开放问题——超图上的拉姆齐风格问题。该问题属于组合数学的核心领域,要求构造尽可能大的超图,使其不具备某个易...

Read More
2026-02-23 talkingdev

OpenAI公布First Proof挑战赛提交结果:AI模型尝试攻克十大专家级数学证明难题

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战,旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

Read More
2026-01-10 talkingdev

AI自主攻克数学难题:陶哲轩证实埃尔德什问题#728首次由人工智能基本独立解决

近日,数学界迎来一项里程碑式进展:著名数学家陶哲轩在其社交账户上宣布,埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献,而是在埃尔德什问题网站社区重构问题...

Read More
2025-06-05 talkingdev

[开源]科学推理基准测试(GitHub Repo):239个问题挑战大语言模型科学推理能力

该GitHub仓库发布了一个包含239个科学推理问题的基准测试集,专门用于评估大语言模型(LLMs)在科学推理任务中的表现,特别是超越简单记忆的方程发现能力。这一基准测试的推出标志着AI领域对模型深层科学理解能力的量...

Read More
2025-03-18 talkingdev

[论文推荐]Funsearch:LLM驱动的遗传算法助力数学家解决组合与数论问题

Funsearch是一种基于大型语言模型(LLM)驱动的遗传算法新实现,旨在帮助数学家解决组合和数论问题,而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力,为数学研究提供了全新...

Read More
2025-01-20 talkingdev

OpenAI注资FrontierMath,推动数学工具创新

近日,人工智能研究实验室OpenAI宣布对FrontierMath进行投资,以支持其在数学工具开发上的进一步创新。FrontierMath是一个专注于数学领域的技术公司,致力于创造能够提高数学研究和教育效率的先进工具。此次注资将帮...

Read More
2024-12-24 talkingdev

人工智能能否解决数学问题?数学家的思考

人工智能领域中,数学能力一直是一个重要话题。随着机器学习技术的不断进步,AI系统似乎已经开始展现出处理复杂数学问题的能力。数学家们对此抱有复杂的情感:一方面,AI的数学能力可以极大地辅助人类解决数学难题,...

Read More
2024-07-11 talkingdev

Hugging Face团队发布强大的数学奥林匹克模型NuminaMath-7B

Hugging Face团队已经发布了一款极为强大且实用的数学模型。这款模型利用了最新的算法技术,能够对各类数学问题进行快速准确的分析并给出解答。无论是复杂的几何问题,还是困难的代数问题,这款模型都能够轻松应对。...

Read More