漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-22 talkingdev

多模态模型训练方法LLaVa,可用于视频生成

LLaVa是一种从文本模型训练多模型的方法。现在它可以用于视频。基于Vicuna的结果模型非常强大,可以轻松实现视频摘要和字幕的最新表现。

Read More
2023-11-22 talkingdev

论文:流行公共模型可能没有在测试集上训练

一种深入研究训练语言模型所使用的数据的方法。研究结果表明,许多闭源模型可能没有在流行的基准测试上进行训练。

Read More
2023-11-21 talkingdev

数据驱动的人工智能崛起

前Atlassian首席技术官兼现任Coatue Ventures董事总经理Sri Viswanath深入探讨了人工智能的现状。虽然这是一份117页的文件,但本文对亮点进行了很好的总结。文章指出,人工智能正在成为一种基础设施,被广泛应用于各...

Read More
2023-11-21 talkingdev

Neural-Cherche:神经搜索模型微调库开源

Neural-Cherche是一个库,旨在为特定数据集微调神经搜索模型,例如Splade,ColBERT和SparseEmbed。 在搜索模型中进行微调可以提高搜索结果的质量,从而更好地满足用户需求。 该库现已开源,可在GitHub上获取。此外,...

Read More
2023-11-21 talkingdev

StyleTTS 2发布:结合风格扩散和对抗训练,实现接近人类自然语音合成

StyleTTS 2是一款文本转语音模型,旨在通过将风格扩散和对抗训练与大型语音语言模型相结合来实现接近人类水平的语音合成。StyleTTS 2是在原有StyleTTS模型的基础上进一步优化,采用了更加先进的多任务学习技术,使得...

Read More
2023-11-21 talkingdev

论文:模型之间的知识转移技术探讨

本文探讨了不同的数据优化方案,以实现在最小的计算成本下,模型之间的知识转移。此技术能够帮助开发人员在不同场景下利用已有的模型知识,从而节省时间和成本。研究人员发现,通过将数据集合并和调整模型参数,可以...

Read More
2023-11-20 talkingdev

音乐领域的ControlNet开源

ControlNet是一种为图像合成模型提供细粒度控制的新颖方法。现在有一种类似的音乐生成模型,可以让您控制许多特征,如语音和音调。这种新型音乐生成模型可以为音乐家们提供更多的创作可能性,使其更好地掌握音乐创作...

Read More
2023-11-20 talkingdev

生产级LLM工具开发者指南

使用语言模型构建工具是一种新兴的工程学科,涵盖了高性能计算、GPU编排和监控。在这个领域,LLMs(语言模型)是至关重要的组件,它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

Read More
  1. Prev Page
  2. 332
  3. 333
  4. 334
  5. Next Page