Llama的相关内容 - 漫话开发者

2023-08-25 talkingdev

人类反馈改善语言模型：DPO在Llama 2的应用

人类反馈在改善语言模型对齐和整体性能方面扮演着关键角色。然而，使用近端策略优化进行训练的过程中存在一些挑战。最近的研究表明，可以直接针对人类偏好进行优化，从而绕过奖励模型。借助基于文本的强化学习，你可...

2023-08-25 talkingdev

Meta发布自己的AI代码编写工具：Code Llama

Meta发布了Code Llama，这是一个建立在Llama 2之上的大型语言模型，专门用于生成和调试代码。它还发布了一个针对Python的特定版本，以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

2023-08-24 talkingdev

Llama.cpp，新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而，它目前受到底层GGML格式的限制。为了解决这个问题，我们提出了一个新的格式，并开始进行集成。新的GGML格式将更加灵活，可以支持更多的模型，这将有助于推动机器...

2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS：复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS，这个名字是一个复杂的缩写，全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本，Flamingo...

2023-08-21 talkingdev

Meta将推出下一个开源AI项目，据说是一个代码生成机器人

据报道，Meta的下一个AI发布将是一台编码机器。它可能会在下周发布。Code Llama将是开源的，并且免费提供。它将基于Llama，并在开发人员输入代码时自动为他们提供代码建议。

2023-08-16 talkingdev

AI与内存壁垒：LLaMA.cpp的崛起之路

LLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook能够以稍慢于A100的速度运行最先进的模型呢？答案在于，当你一次只处理一个批次，一个标记的时候，内存带宽就成了瓶颈。而M2的内存带宽与A100的之间的差距...

2023-08-14 talkingdev

Orca与Platypus LLM的强大结合

众多模型都基于Llama 2进行构建，并在GPT-4的输出上进行训练。在非商业许可的模型中，Orca和Platypus LLM的结合表现出了强大的能力。这些模型可以说是处于这个范围，但它们已经非常强大。基于Llama 2的模型数量众多...

2023-08-14 talkingdev

ChainML发布开源AI Agent平台Council

近期，ChainML发布了Council——一款开源的AI代理平台，它使得快速开发和部署定制的生成AI应用变得简单。Council可以与多种语言理解模型（LLMs）如GPT-4、Llama 2和Claude 2等进行集成，以实现业务应用的生成AI，从而...