强化学习预训练(Reinforcement Pre-Training, RPT)作为大语言模型(LLM)与强化学习(RL)协同进化的前沿技术,提出了一种革命性的规模化训练范式。该技术通过创新性地利用海量文本数据进行通用强化学习预训练,在...
Read More苹果公司研究团队通过定制化谜题环境对大型推理模型(LRMs)进行了系统性评估,揭示了人工智能推理能力的重要局限性。研究发现,随着任务复杂度提升,LRMs会经历推理效能先上升后急剧下降的拐点现象,最终在高度复杂任...
Read More一项突破性研究通过对比模型在随机数据(无法泛化)和真实文本上的训练表现,开发出区分记忆与泛化的新方法。研究发现,模型会先记忆训练数据直至容量饱和,随后转向学习通用模式。以GPT类Transformer为例,每个参数...
Read More近日,Kiln公司发布了一篇关于大型语言模型(LLM)微调的深度指南,引发了开发者社区的广泛讨论。文章详细探讨了在什么情况下需要对预训练的大型语言模型进行微调,以及如何开始这一过程的技术细节。随着ChatGPT等大模...
Read MoreDeepSeek团队在Hugging Face平台发布了最新的大语言模型DeepSeek-R1-0528,引发了技术社区的广泛关注。该模型在Hacker News上获得了330个点赞和148条评论,显示出业界对其技术价值的认可。作为开源大模型领域的重要...
Read More研究人员近日推出名为SpatialScore的多模态基准测试套件,专门用于评估大型模型在3D空间理解方面的能力。这一创新性基准整合了来自12个不同数据集的28,000个样本,为衡量AI系统的空间推理性能提供了全面且标准化的评...
Read More谷歌最新一期Release Notes播客深度解析了I/O 2025大会的AI技术突破,重点介绍了三大核心创新:1) Gemini 2.5 Pro Deep Think作为下一代多模态AI系统,通过增强的递归神经网络架构实现复杂逻辑推理,其万亿级参数规...
Read MoreOpenAI宣布与阿联酋科技集团G42等合作伙伴共同在阿布扎比建设超大规模人工智能数据中心Stargate UAE。该设施设计容量达1吉瓦,建成后将成为全球算力最强的AI基础设施之一。作为阿联酋国家AI战略的核心项目,首期200...
Read More