一项发表于arXiv预印本平台的最新研究《Professional Software Developers Don't Vibe, They Control: AI Agent Use for Coding in 2025》深入探讨了AI智能体(AI Agents)在专业软件开发中的实际应用与影响。该研究...
Read More一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练,从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段:...
Read More人工智能学术研究平台alphaXiv于近日宣布获得700万美元种子轮融资,本轮融资由Menlo Ventures和Haystack共同领投。该平台致力于构建围绕arXiv预印本论文的开放学术社区,允许研究人员对论文进行实时批注、评论和深度...
Read More来自大规模实验的研究团队发布了名为ScaleRL的创新框架,这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据,构建了可预测的S型计算-性能曲线,揭示了RL训练中算法改...
Read More一项发表于arXiv的前沿研究显示,大型语言模型(LLM)通过创新的语义相似性评分方法,在57种个人护理产品的消费选择预测中成功复现了人类决策模式,达到人类测试重测可靠性的90%。传统调研方法依赖数值评分易导致数...
Read More清华大学与斯坦福大学联合研究团队近日发布突破性研究成果ReasoningBank,该框架通过构建推理记忆系统解决长期困扰大语言模型智能体的历史经验复用难题。传统智能体在持续执行现实任务时,往往将每次交互视为独立事...
Read MoreMeta研究团队在最新论文中提出名为“早期经验”的创新训练范式,为解决语言智能体在复杂现实任务中的自主学习难题提供了突破性方案。传统方法依赖专家演示数据进行监督微调,存在泛化能力弱、数据多样性不足的缺陷。而...
Read MoreMeta Superintelligence Labs于arXiv发布编号2509.01092的首篇论文,引发学术社区高度关注。该研究并未延续当前大模型参数规模竞赛的常规路径,而是聚焦于注意力机制的基础架构创新。论文提出了一种名为"动态稀疏注...
Read More