漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-29 talkingdev

ChatMusician:将音乐转化为ABC符号可提高音乐理解能力

音乐理解通常需要在语言模型中添加特定编码器,这往往既昂贵又不稳定。然而,一项新的研究发现,将音乐转换为ABC符号后,音乐理解能力显著提高,且不会影响基本的语言能力。

Read More
2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日,Facebook发布了一款最先进的开源音频模型MaGNET,该模型速度是其他替代品的7倍,而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布,更多详情请访问GitHub仓库。

Read More
2024-02-13 talkingdev

Google研究:从人脑中读取音乐

Google最近发布了一段7分钟的视频,介绍了他们的Brain2Music项目,该项目旨在通过读取人脑信号来生成音乐。该项目使用深度学习技术来识别人脑中与音乐有关的信号,并将其转换为音乐的元素,如节拍、旋律和和弦。该技...

Read More
2024-02-09 talkingdev

Google MusicLM团队使用RL技术提升音乐生成模型表现

Google的MusicLM团队使用了300k份反馈和其他奖励信号,在其音乐生成模型上运行了RL过程。他们发现该模型在人类偏好研究中表现优异,但尚不清楚哪种RL方法能产生最高保真度的输出。

Read More
2024-02-06 talkingdev

IMG2Music-图像转音乐方案

通过将图像转换为文本,文本转化为提示,提示转化为音乐,可以创建一个引人入胜的图像到音乐的流水线。

Read More
2024-01-26 talkingdev

音乐与语言模型评估数据集发布

Song Describer数据集包含1000多个人工编写的音乐记录描述,该数据集可帮助评估音乐与语言模型,例如音乐字幕和文本转音乐生成。

Read More
2024-01-22 talkingdev

Meta发布音乐和声音生成模型(HuggingFace Hub)

Meta最近推出了一系列令人难以置信的音乐和声音生成模型,并发布了推理代码。这些模型是通过机器学习训练的,可以生成高质量的音乐和声音效果。该公司表示,这些模型可以用于广泛的应用场景,包括游戏声音、虚拟现实...

Read More
2024-01-10 talkingdev

Rabbit R1:AI 助手智能独立设备

Rabbit R1 是一款售价为199美元的独立设备,只有 iPhone 大小一半,由 'Large Action Model' 驱动。它有一个 2.88 英寸的触摸屏、一个用于拍照和录像的旋转摄像头、一个用于导航的滚轮/按钮、128GB 的存储空间和一整...

Read More
2023-12-21 talkingdev

微软Copilot通过与GenAI音乐应用Suno的集成,获得音乐创作功能

微软Copilot是一款基于人工智能的代码辅助工具,能够快速生成代码,提高开发效率。近日,微软宣布Copilot将与GenAI音乐应用Suno进行集成,获得音乐创作功能。通过这一功能,Copilot可以帮助音乐人快速生成和编辑歌曲...

Read More
2023-12-20 talkingdev

Amphion-开源多媒体资源生成工具包

Amphion是一款新的媒体生成工具包,支持音乐和语音,并且团队正在努力添加更多的模型。该工具包基于开源技术,可自由使用和修改。

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page