一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...
Read More近日,一位开发者为解决自身普通话声调学习的痛点,训练并开源了一个超轻量级的语音评估模型。该模型专门用于对普通话的发音和声调进行实时评分与纠正,为解决语言学习中“听不出自身错误”的普遍难题提供了技术方案。...
Read More在AI编程助手领域,一个长期存在的痛点是模型知识库的滞后性,这常导致其生成基于过时API的代码。Vercel的研究团队针对这一核心问题,对两种为AI代理提供最新Next.js 16框架文档的方法进行了系统性评估。传统方案“技...
Read More据The Information报道,谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型,其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...
Read More根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...
Read More近日,GitHub上开源了一个名为E2E的JAX官方实现项目,它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构,并配合滑动窗口注...
Read More近日,一个名为LMCache的开源项目在GitHub上发布,旨在通过创新的键值(KV)缓存加速层,显著提升大型语言模型(LLM)的服务性能。该项目专为LLM推理服务设计,其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...
Read More近期,在社交媒体和各类论坛上,一种值得警惕的现象日益凸显:许多用户倾向于通过互联网寻求对个人具体境遇的“预测性建议”,以期在面临不确定性时获得心理安全感。这种行为模式背后,反映的是对数字信息环境的过度依...
Read More