语言模型的相关内容 - 漫话开发者

2023-08-25 talkingdev

人类反馈改善语言模型：DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而，使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明，可以直接针对人类偏好进行优化，从而绕过奖励模型。借助基于文本的强化学习，你可...

2023-08-25 talkingdev

法律推理基准：测量语言模型在法律框架中的推理能力

在一个大规模的合作努力下，我们构建了一个基准，用于度量语言模型在法律框架中的推理能力。这项工作的关键在于，我们需要警惕已经训练过的模型中的污染。语言模型在训练过程中可能会被各种各样的数据源影响，这些数...

2023-08-25 talkingdev

cheetah：开源的多模态语言模型，用于处理视觉-语言任务

近期的模型常常在处理复杂的视觉-语言任务上遇到困难，这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务，研究人员引入了I4基准。结果显示，视觉提示生成器的注意力存在缺陷。为了解决这个...

2023-08-25 talkingdev

Meta发布自己的AI代码编写工具：Code Llama

Meta发布了Code Llama，这是一个建立在Llama 2之上的大型语言模型，专门用于生成和调试代码。它还发布了一个针对Python的特定版本，以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

2023-08-24 talkingdev

Llama.cpp，新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而，它目前受到底层GGML格式的限制。为了解决这个问题，我们提出了一个新的格式，并开始进行集成。新的GGML格式将更加灵活，可以支持更多的模型，这将有助于推动机器...

2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS：复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS，这个名字是一个复杂的缩写，全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本，Flamingo...

2023-08-22 talkingdev

FlexFlow，开源的LLM部署框架

Flex flow LLM部署框架是一款强大的软件，专门设计来支持语言模型在生产系统中的部署。它能够提供高效、灵活的解决方案，以满足各种复杂环境下的部署需求。此外，它还具有出色的兼容性和扩展性，可以与各种主流的语...

2023-08-21 talkingdev

你可能不需要微调大型语言模型

对于大多数大型语言模型（LLM）应用，微调并非必要。使用少量提示或检索增强生成（RAG）可能是更好的选择。少量提示是指向LLM提供期望输出的示例，而RAG则涉及查询向量数据库，获取LLM未经训练的信息。这意味着，我...