漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-25 talkingdev

Meta发布自己的AI代码编写工具:Code Llama

Meta发布了Code Llama,这是一个建立在Llama 2之上的大型语言模型,专门用于生成和调试代码。它还发布了一个针对Python的特定版本,以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

Read More
2023-08-24 talkingdev

Llama.cpp,新的GGML格式可支持更多模型

Llama.cpp是一个运行本地语言模型的简便方式。然而,它目前受到底层GGML格式的限制。为了解决这个问题,我们提出了一个新的格式,并开始进行集成。新的GGML格式将更加灵活,可以支持更多的模型,这将有助于推动机器...

Read More
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-21 talkingdev

Meta将推出下一个开源AI项目,据说是一个代码生成机器人

据报道,Meta的下一个AI发布将是一台编码机器。它可能会在下周发布。Code Llama将是开源的,并且免费提供。它将基于Llama,并在开发人员输入代码时自动为他们提供代码建议。

Read More
2023-08-16 talkingdev

AI与内存壁垒:LLaMA.cpp的崛起之路

LLaMA.cpp的崛起令许多人感到惊讶。为什么一台普通的MacBook能够以稍慢于A100的速度运行最先进的模型呢?答案在于,当你一次只处理一个批次,一个标记的时候,内存带宽就成了瓶颈。而M2的内存带宽与A100的之间的差距...

Read More
2023-08-14 talkingdev

Orca与Platypus LLM的强大结合

众多模型都基于Llama 2进行构建,并在GPT-4的输出上进行训练。在非商业许可的模型中,Orca和Platypus LLM的结合表现出了强大的能力。这些模型可以说是处于这个范围,但它们已经非常强大。基于Llama 2的模型数量众多...

Read More
2023-08-14 talkingdev

ChainML发布开源AI Agent平台Council

近期,ChainML发布了Council——一款开源的AI代理平台,它使得快速开发和部署定制的生成AI应用变得简单。Council可以与多种语言理解模型(LLMs)如GPT-4、Llama 2和Claude 2等进行集成,以实现业务应用的生成AI,从而...

Read More
2023-08-11 talkingdev

论文:通过在上下文中学习提升Llama-2模型的性能

在一篇新的研究报告中,研究人员在聊天式提示中通过检索9个演示示例,使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重,但它使得与文本达芬奇-003模型相比,赢率增加了7倍,使其...

Read More
2023-08-10 talkingdev

最快方式打造定制版Llama2模型

通过上传JSONL数据到你的云端硬盘,链接并运行带有QLoRA和SFT训练的笔记本,你就可以得到一个定制调整的Llama2模型。这似乎是我发现的最简单的调整例子,并且效果很好。最重要的是,该模型使用了(提示,响应)的格...

Read More
2023-08-10 talkingdev

从零开始训练Llama:一步步指导TinyShakespeare

本文将详细介绍如何使用Llama论文来训练TinyShakespeare。Llama是一个新型的人工智能训练模型,具有高效和精准的特性。TinyShakespeare是一个文本生成模型,其设计目标是模仿莎士比亚的写作风格生成文本。本指南将带...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page