评估训练编程语言模型的性能是一个具有挑战性的任务。大多数人使用OpenAI的HumanEval。然而,一些开放的模型似乎会过度拟合到这个基准。LiveCodeBench是一种测量编程性能的方法,同时减轻污染问题。
Read MoreMoAI是一种新型的大型语言和视觉模型,它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布,旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法,可以...
Read More该项目提出了一种改善大型视觉语言模型(例如LLaVA-1.5、QwenVL-Chat和Video-LLaVA)效率的方法,解决了“低效的注意力”问题。使用FastV这种新方法,通过修剪视觉令牌和学习自适应注意力模式来优化这些模型,从而显著...
Read MoreOpenAI的超对齐团队开发了一款名为Transformer Debugger的工具,以支持对小型语言模型的特定行为进行调查。该工具将自动可解释性技术与稀疏自编码器相结合。
Read MoreTransformer Debugger是一种工具,它通过将自动可解释性技术与稀疏自动编码器相结合,支持对小型语言模型的特定行为进行调查。
Read More人工智能控制界面(AICI)使您能够构建控制器,以实时约束和指导大型语言模型的输出。通过AICI,用户可以使用自己的约束条件或限制来约束模型的输出,同时还可以通过实时反馈来调整约束条件,从而实现更好的模型输出...
Read MoreCohere For AI发布了一个30B+参数模型,该模型在10种语言的推理、摘要和问答方面非常擅长。该模型名为Command-R,是自然语言处理领域的一项重大突破。Command-R模型可以在多语言环境下进行推理和答案提取,这对于跨...
Read MoreCovariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...
Read More据Elon Musk在X上透露,xAI的语言模型Grok将在未来几天内开源。 Grok是xAI的一项重要技术,它基于深度学习技术,能够快速地处理自然语言,并在文本中找到有意义的信息。Grok已经在xAI内部使用了很长时间,现在将会对...
Read More