漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-13 talkingdev

Axiom以16亿美元估值融资2亿美元,用“形式化验证”打造可信AI编程助手

硅谷初创公司Axiom在成立仅一年、团队约20人规模之际,成功完成了由Menlo Ventures领投的2亿美元A轮融资,估值高达16亿美元。该公司致力于开发名为“Verified AI”的系统,其核心创新在于利用形式化验证技术,确保AI生...

Read More
2026-02-23 talkingdev

OpenAI公布First Proof挑战赛提交结果:AI模型尝试攻克十大专家级数学证明难题

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战,旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

Read More
2026-02-14 talkingdev

AI再突破:GPT-5.2独立推导出理论物理学新成果,获学界验证

近日,一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示,其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果:它独立地提出了一个关于胶子散射振幅的新公...

Read More
2026-01-10 talkingdev

AI自主攻克数学难题:陶哲轩证实埃尔德什问题#728首次由人工智能基本独立解决

近日,数学界迎来一项里程碑式进展:著名数学家陶哲轩在其社交账户上宣布,埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献,而是在埃尔德什问题网站社区重构问题...

Read More
2025-10-05 talkingdev

开源|ProofOfThought:基于Z3定理证明的LLM神经符号推理框架

NeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法,通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制,实现了兼具鲁棒性与可解释性的自动推理...

Read More
2025-08-18 talkingdev

超越布尔逻辑:TypeScript与Lean语言在逻辑表达上的本质差异

在编程语言的世界中,逻辑表达通常以布尔类型(boolean)为基础,即真(true)或假(false)。然而,TypeScript和Lean语言在逻辑表达的处理上展现出截然不同的哲学。TypeScript沿袭传统,将逻辑表达式视为布尔类型,...

Read More
2025-05-27 talkingdev

[论文推荐]ICYM2I框架:基于逆概率加权的多模态学习缺失模态评估新方法

来自arXiv的最新研究提出ICYM2I框架,通过逆概率加权技术解决多模态模型在数据缺失场景下的信息增益评估偏差问题。该研究针对医疗影像、自动驾驶等依赖多源数据融合的前沿领域,首次系统性地建立了缺失模态条件下的...

Read More
2025-05-07 talkingdev

[论文推荐]Chain of Draft:高效推理新范式,显著降低计算成本

近日,一项名为Chain of Draft的创新推理策略在arXiv预印本平台引发关注。该技术通过精简推理路径设计,在保持与经典Chain-of-Thought方法相当甚至更高准确率的前提下,显著降低了大型语言模型的token消耗量。实验数...

Read More
  1. Next Page