Meta公司最新推出了名为CWM(Code World Model)的开源大语言模型,该模型参数量达320亿,采用仅解码器架构。其创新之处在于训练数据融合了代码执行轨迹与复杂推理任务,旨在构建能够理解代码动态执行过程的‘世界模...
Read MoreQuesma实验室最新发布的Tau²基准测试研究表明,通过精细化提示词工程可显著提升轻量级AI模型在工具调用场景中的表现。该团队针对GPT-5-mini模型进行提示词重构后,在模拟真实工具使用场景的基准测试中成功率提升超20...
Read More在2025年国际大学生程序设计竞赛(ICPC)世界总决赛期间,OpenAI的GPT-5和谷歌的Gemini 2.5 Deep Think两大前沿AI系统在独立测试中取得突破性表现。尽管未与人类队伍同台竞技,但这些企业级AI工具在ICPC官方规则和监...
Read More人工智能基础设施初创公司Upscale AI近日宣布完成超过1亿美元的种子轮融资,本轮由Mayfield和Maverick Silicon联合领投。该公司专注于开发基于开放标准的网络工具套件,旨在解决AI计算中日益严峻的网络瓶颈问题。随...
Read More月之暗面(Moonshot AI)团队在其技术博客中详细披露了Kimi K2模型在强化学习训练领域的重大突破。该团队成功实现了对1万亿参数模型的RL参数更新仅需约20秒,这一突破性进展解决了强化学习端到端训练过程中的关键效率...
Read More中国互联网巨头腾讯和百度在2025年通过香港离岸人民币债券市场(点心债市场)合计发行33亿美元债券,创下中国科技企业有史以来最大规模的境外债券融资纪录。这一融资行为主要旨在为人工智能基础设施建设和技术研发获...
Read More中国科技行业正掀起一场前所未有的AI投资浪潮。阿里巴巴、腾讯和百度三大巨头本月通过发行债券筹集超过50亿美元资金,重点投向人工智能和数字基础设施领域。若加上京东,这四家企业2025年在AI领域的资本支出总额预计...
Read MoreMeta公司内部团队与vLLM、PyTorch展开深度技术合作,成功推出预填充/解码分离技术(prefill/decode disaggregation),这项突破性技术显著提升了大规模语言模型在生产环境中的推理性能。通过将推理过程分解为预填充...
Read More