硅谷初创公司Axiom在成立仅一年、团队约20人规模之际,成功完成了由Menlo Ventures领投的2亿美元A轮融资,估值高达16亿美元。该公司致力于开发名为“Verified AI”的系统,其核心创新在于利用形式化验证技术,确保AI生...
Read MoreOpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战,旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...
Read More近日,一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示,其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果:它独立地提出了一个关于胶子散射振幅的新公...
Read More近日,数学界迎来一项里程碑式进展:著名数学家陶哲轩在其社交账户上宣布,埃尔德什问题#728在人工智能工具的辅助下首次被基本自主地解决。这一突破性成果并非简单复现已有文献,而是在埃尔德什问题网站社区重构问题...
Read MoreNeurIPS 2024系统推理研讨会最新收录的研究项目ProofOfThought提出了一种突破性的神经符号编程合成方法,通过结合大型语言模型的语义理解能力与Z3定理证明器的形式化验证机制,实现了兼具鲁棒性与可解释性的自动推理...
Read More在编程语言的世界中,逻辑表达通常以布尔类型(boolean)为基础,即真(true)或假(false)。然而,TypeScript和Lean语言在逻辑表达的处理上展现出截然不同的哲学。TypeScript沿袭传统,将逻辑表达式视为布尔类型,...
Read More来自arXiv的最新研究提出ICYM2I框架,通过逆概率加权技术解决多模态模型在数据缺失场景下的信息增益评估偏差问题。该研究针对医疗影像、自动驾驶等依赖多源数据融合的前沿领域,首次系统性地建立了缺失模态条件下的...
Read More近日,一项名为Chain of Draft的创新推理策略在arXiv预印本平台引发关注。该技术通过精简推理路径设计,在保持与经典Chain-of-Thought方法相当甚至更高准确率的前提下,显著降低了大型语言模型的token消耗量。实验数...
Read More