硅谷初创公司Axiom在成立仅一年、团队约20人规模之际,成功完成了由Menlo Ventures领投的2亿美元A轮融资,估值高达16亿美元。该公司致力于开发名为“Verified AI”的系统,其核心创新在于利用形式化验证技术,确保AI生...
Read More微软近日发布了Phi-4-reasoning-vision-15B,这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数,却在数学、科学、文档及用户界面(UI)推理任务上,达到了与参数量大数倍的模型相当甚至更优的性...
Read MoreOpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战,旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...
Read More近日,一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示,其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果:它独立地提出了一个关于胶子散射振幅的新公...
Read More近日,Chainlift公司正式发布了名为LiftKit的开源UI框架,旨在为追求极致视觉体验的开发者与设计师提供一套基于数学美学的解决方案。该框架的核心创新在于将经典的黄金比例(Golden Ratio)系统地应用于用户界面的构...
Read More近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...
Read More一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...
Read More近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...
Read More