HuggingFace团队成功复现了OpenAI的第一个RLHF代码库,该代码库于2019年发布,是引入了一些最初的RLHF(强化学习与人类因素)想法。这个代码库被称为“Generative Pretraining Transformer(GPT)”。通过在计算机上训...
Read MoreSpellTest是基于Github的一个新项目,旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法,常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误,并自动...
Read MoreDeepSparse是一种CPU推理运行时,它利用稀疏性加速神经网络推理。稀疏性是指神经网络中有很多权重为零的连接,DeepSparse利用这些零权重的连接,跳过不必要的计算,从而实现推理加速。DeepSparse是一个开源项目,可...
Read MoreMonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...
Read More本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。
Read MoreLibgen是许多封闭模型中的数据集。虽然这个数据集的商业使用合法性存在争议,但研究人员仍在使用它来更好地了解语言模型训练数据质量。这个开源的GitHub代码库旨在将Libgen转换为txt文本文档的形式,以便更方便地进...
Read MoreCtoc是一个开源项目,其主要功能是提供一种轻量级的代码库分析工具,可以在令牌级别分析代码库。这种工具允许开发者更深入地理解他们的代码,特别是在处理大型代码库时,它可以帮助开发者更有效地定位和解决问题。Ct...
Read MoreSapientML是一个自动化机器学习(AutoML)技术,它能从已有的数据集以及人类编写的管道学习,并针对新数据集的预测任务有效地生成高质量的管道。这个技术的核心在于,它能够理解和学习人的编程风格和思维方式,从而...
Read More云开发环境(CDEs)变得越来越受欢迎。本文介绍了为什么CDE正在流行以及初创企业在这个领域应该寻找什么。CDE的普及原因是因为代码库变得更大,单体库变得更受欢迎,笔记本电脑性能趋于平稳,连接正在改善,以及远程...
Read More