训练模型的相关内容 - 漫话开发者

2023-10-31 talkingdev

Magnetic：轻松将LLM集成到您的Python中

Magnetic是一个用于轻松集成大型语言模型到Python代码的库。这个名为Magnetic的库是由NLP引擎提供商Hugging Face发布的。基于Transformers，Magnetic允许您轻松地将大型语言模型集成到您的Python代码中，以进行各种...

2023-10-03 talkingdev

语言模型的性能往往受到其上下文长度的限制。一般来说，上下文长度的限制主要源于计算硬件和聪明的算法更新。StreamingLLM（Github Repo）提供了一种算法更新，通过将令牌流式传输至注意力机制，理论上可以支持无限...

2023-09-22 talkingdev

这项研究介绍了AV-SUPERB，这是一个新的基准测试，用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展，并为未来的研究提供一个统一的平台。这项研究突出了模...

2023-09-06 talkingdev

近日，人工智能科技公司Hugging Face发布了一项新的服务，该服务使得用户无需处理复杂的内部过程，仅需一键，即可对模型进行训练。这项创新型服务意味着，用户可以省去在深度学习项目中进行模型训练时，所需投入的大...

2023-08-10 talkingdev

本文将详细介绍如何使用Llama论文来训练TinyShakespeare。Llama是一个新型的人工智能训练模型，具有高效和精准的特性。TinyShakespeare是一个文本生成模型，其设计目标是模仿莎士比亚的写作风格生成文本。本指南将带...

2023-08-07 talkingdev

本文是对LLMs领域近几年发展的总结，旨在帮助行外人士了解LLMs是什么、可以用于什么、如何训练它们以及在使用它们时所面临的挑战，包括安全性、效果和伦理等方面。文章包含了演讲中的带有注释的幻灯片以及额外的笔记...

2023-07-31 talkingdev

transformer模型帮助机器人看，帮助机器人计划，甚至帮助机器人控制？看起来，变形金刚正在继续吞噬世界，这是谷歌在机器人技术方面的最新尝试，利用强大的预训练模型改善机器人的各种性能。这一新的尝试使得机器人...

2023-07-19 talkingdev

这篇论文提出了一种新的图像协调方法，不同于以往的方法，这种方法并不依赖于大量的合成图像，这使得其训练成本更低，更具泛化性。在以往的方法中，需要大量的合成图像来训练模型，而这篇论文提出的方法，通过预训练...