模型训练的相关内容 - 漫话开发者

2024-07-16 talkingdev

LAPT自动化异常值检测：提高视觉语言模型的表现

近日，研究人员提出了一种新的方法——标签驱动的自动提示调整(LAPT)，用于视觉语言模型如CLIP的异常值检测。这种新方法可以自动识别出数据集中的异常值，提高模型在处理各种情况时的灵活性和准确性。通过LAPT，可以更...

2024-07-15 talkingdev

AuraFlow是由Fal训练的全新开放模型。这款模型采用了muP进行训练，是一款拥有58亿参数的模型。AuraFlow的开发标志着Fal在人工智能领域的又一次重大突破，展示了其强大的技术实力和深厚的研发能力。此次训练使用的muP...

2024-07-10 talkingdev

Tinygrad是一款用于训练深度学习模型的工具包。这套笔记是AI编译器的极佳入门读物，更是为深入了解Tinygrad内部机制做好准备。Tinygrad以其精简的设计和高效的性能，为AI领域带来了新的可能性。无论你是AI领域的专家...

2024-06-26 talkingdev

近日，AI与Morph Labs联合发布了一篇关于信息检索增强型生成（RAG）模型微调的优秀博客文章。在文章中，他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型，它结合了信息检索技术...

2024-06-13 talkingdev

近日，Meta公司公布了一篇关于其如何规模化训练大型语言模型的论文。该论文详细介绍了Meta公司的训练方法，该方法可以同时训练多达14亿个参数的语言模型。该规模远超以往的语言模型训练规模，并且可以在更短的时间内...

2024-06-12 talkingdev

Coqui.ai TTS是一款用于文本转语音的深度学习工具包，它支持多种语言和声音风格，并可在较低的计算资源上实现高质量的语音合成。该工具包基于TensorFlow 2和PyTorch，是一款开源、易于使用的工具，可帮助研究人员和...

2024-06-04 talkingdev

训练语言模型需要数万亿高质量的标记数据。关于这些数据集构建的信息大多未公开。然而，FineWeb团队在一篇精彩的博文中讨论了不同的数据集清理和过滤策略。文章的作者们发布了许多顶级的数据集，用于语言模型训练。...

2024-06-03 talkingdev

muP 是一种被所有前沿模型实验室广泛使用的强大工具，用于将小模型上调优的超参数转移到更大、更昂贵的训练任务中。本文探讨了如何将这种技术应用于稀疏模型，从而显著提升训练性能，同时降低计算成本。通过muP，研...