漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-02 talkingdev

只需1美元的算力,为Mistral进行微调

Mistral是一种基于深度学习的自然语言处理模型,其7B模型是目前最大的公开模型之一。现在,您可以使用Jupyter笔记本,根据自己的数据集对Mistral的7B模型进行微调,并仅需1美元的计算费用。微调Mistral模型可以提高...

Read More
2023-09-28 talkingdev

Mistral发布首个性能卓越的7B模型

在完成巨额种子轮融资并组建团队、机器学习堆栈和数据管道后,Mistral团队已经发布了一个性能极高的7B模型。该模型最初通过磁力链接(种子)以及一个最小化的GitHub Repo和宽松的许可证发布。这显示了Mistral团队在...

Read More
2023-06-23 talkingdev

MPT 30B发布:具备编码能力的巨型语言模型

MPT是MosaicML推出的一系列语言模型。仅在推出几周内,其7B模型已经被下载了数百万次。这款全新的30B模型是在H100s上进行训练的,具备8000个上下文长度。它经过商业授权,甚至可以进行编码!该模型可以在单个A100上...

Read More
2023-06-07 talkingdev

RedPajama 7B模型完成训练

## 新闻概要: - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容:...

Read More
2023-06-01 talkingdev

本地GPT:使用Vicuna-7B模型和InstructorEmbeddings实现离线问答

近日,开发者们在GitHub上发布了一个名为localGPT的Repo,该项目利用Vicuna-7B模型和InstructorEmbeddings实现了离线文档问答功能。以下是该项目的主要亮点: - 使用Vicuna-7B模型:该模型是由EleutherAI开发的巨型...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page