语言模型的相关内容 - 漫话开发者

2023-10-31 talkingdev

ICTC-个性化图像聚类库开源

这篇论文介绍了一种名为IC⁠TC的基于文本条件的图像聚类方法，该方法利用视觉语言模型根据用户提供的文本描述对图像进行排序。IC⁠TC方法使用了预训练的视觉语言模型来生成图像和文本之间的嵌入，然后使用这些嵌入来聚...

2023-10-31 talkingdev

MosaicML发布了一篇关于使用AMD GPU进行大型语言模型训练的文章。该公司在本文中介绍了他们的最新研究结果，使用AMD Radeon Instinct MI100 GPU对GPT-2、GPT-3和T5等大型语言模型进行了训练。结果显示，使用AMD GPU...

2023-10-30 talkingdev

在最新的研究中，科学家们介绍了一种名为LLM-FP4的新型方法，该方法能够通过在训练后将大型语言模型的权重和活动转换为4位浮点值，实现对其进行压缩。这种技术的创新之处在于，它不仅能够显著减少模型的存储需求，还...

2023-10-27 talkingdev

本研究介绍了LLM-FP4，这是一种新的方法，通过在训练后将大型语言模型的权重和操作转换为4位浮点值来压缩它们。近年来，由于NLP任务的快速发展，语言模型的大小和计算需求不断增加，这给模型的部署和使用带来了很多...

2023-10-26 talkingdev

SpellTest是基于Github的一个新项目，旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法，常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误，并自动...

2023-10-25 talkingdev

近日，研究人员开源了名为AgentTuning的GitHub仓库。该仓库提供了一种新的方法来调整语言模型。这种方法通过多个智能体任务中的交互轨迹来训练和调整语言模型，从而更好地适应不同的任务和场景。这种方法可以提高语...

2023-10-25 talkingdev

Cola是一个使用大型语言模型来协调各种视觉语言模型（VLM）以改进视觉推理的系统。该代码库已经在GitHub上发布。

2023-10-24 talkingdev

OpenAgents是一款用于编写语言模型插件的框架，它为用户提供了完全的控制权。该框架可以帮助用户快速构建自己的语言模型，同时具备高度的灵活性和可扩展性，用户可以根据自己的需求自由地进行定制和扩展。OpenAgents...