漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-09 talkingdev

Google MusicLM团队使用RL技术提升音乐生成模型表现

Google的MusicLM团队使用了300k份反馈和其他奖励信号,在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异,但尚不清楚哪种RL方法能产生最高保真度的输出。

Read More
2024-02-06 talkingdev

IMG2Music-图像转音乐方案

通过将图像转换为文本,文本转化为提示,提示转化为音乐,可以创建一个引人入胜的图像到音乐的流水线。

Read More
2024-01-26 talkingdev

音乐与语言模型评估数据集发布

Song Describer数据集包含1000多个人工编写的音乐记录描述,该数据集可帮助评估音乐与语言模型,例如音乐字幕和文本转音乐生成。

Read More
2024-01-22 talkingdev

Meta发布音乐和声音生成模型(HuggingFace Hub)

Meta最近推出了一系列令人难以置信的音乐和声音生成模型,并发布了推理代码。这些模型是通过机器学习训练的,可以生成高质量的音乐和声音效果。该公司表示,这些模型可以用于广泛的应用场景,包括游戏声音、虚拟现实...

Read More
2024-01-10 talkingdev

Rabbit R1:AI 助手智能独立设备

Rabbit R1 是一款售价为199美元的独立设备,只有 iPhone 大小一半,由 'Large Action Model' 驱动。它有一个 2.88 英寸的触摸屏、一个用于拍照和录像的旋转摄像头、一个用于导航的滚轮/按钮、128GB 的存储空间和一整...

Read More
2023-12-21 talkingdev

微软Copilot通过与GenAI音乐应用Suno的集成,获得音乐创作功能

微软Copilot是一款基于人工智能的代码辅助工具,能够快速生成代码,提高开发效率。近日,微软宣布Copilot将与GenAI音乐应用Suno进行集成,获得音乐创作功能。通过这一功能,Copilot可以帮助音乐人快速生成和编辑歌曲...

Read More
2023-12-20 talkingdev

Amphion-开源多媒体资源生成工具包

Amphion是一款新的媒体生成工具包,支持音乐和语音,并且团队正在努力添加更多的模型。该工具包基于开源技术,可自由使用和修改。

Read More
2023-12-06 talkingdev

微软推出初学者生成式AI在线课程

微软发布了一份针对初学者的12节生成式人工智能课程。该课程旨在帮助学生了解生成式人工智能的基础知识和概念。学生将学习如何使用Python编程语言和TensorFlow机器学习框架来构建和训练生成式模型。课程包括理论和实...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page