OpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder,通过训练合成多轮数据集和使用人类反馈,能够在编程HumanEval基准测试中获得85%以上的准确率。
Read MoreSnap研究开发了一种视频生成模型,其速度比之前的最先进模型快3倍(排除Sora)。该模型可以生成高质量的视频,并且在处理速度方面具有显著优势。Snap的这项技术将对视频制作、社交媒体、游戏等领域产生重大影响。
Read MoreGeneOH扩散技术是一种新的技术,它通过改正手部动作和与物体的关系中的错误来提高模型对物体的理解和交互。这种方法专注于使这些交互更加自然。
Read More研究人员开发了一种新方法,通过采用专家级稀疏化方法来使LLMs更加高效和易于使用,该方法可以在不损失性能的情况下减少模型大小。这对于Mixture-of-Experts LLMs尤其有用,这种模型通常太大而不易处理。
Read MoreAlphaFold被用于预测蛋白质折叠后的状态。通过添加可逆的流匹配,您可以在整个蛋白质领域显著提高建模能力。在蛋白质结构预测领域,AlphaFold目前是最先进的计算机程序之一,它使用深度学习技术来预测蛋白质的三维结...
Read More谷歌承认其AI模型Gemini存在问题。该模型会向历史图像中注入不适当的多样性,反映出训练数据中存在偏见的问题。这个缺陷引发了有关科技领域中多样性、公平性和包容性的讨论。谷歌暗示将来会做出改进,但没有就AI在生...
Read MoreR2R是一个半正式框架,旨在快速部署生产级RAG系统。它旨在弥合实验性RAG模型和生产就绪系统之间的差距。R2R为在生产环境中部署、适应和维护RAG管道提供了简单的路径。现已提供短视频演示。
Read MoreMistral AI推出了一款名为Mistral Large的新型语言大模型,以与GPT-4和Claude 2等顶级模型竞争。该公司还推出了一项名为Le Chat的新服务,以与ChatGPT竞争。通过该公司的API,访问Mistral Large的成本为每百万输入令...
Read More