漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-04 talkingdev

论文:深度学习助力全能音效移除系统的构建

近期,音频深度学习领域焕发新生。通过使用一个分类器,接着是特定效果的模块,我们可以构建一个全能系统,逐步从已混合的音频中移除混响或延迟等效果。这种技术不仅能够增强音频处理的效率,还能改进音频的整体质量...

Read More
2023-08-29 talkingdev

AudioLDM2-声音与音乐生成模型开源

近日,一款出色的开源声音与音乐生成模型在GitHub上引发关注。这款模型运行速度快,能生成节拍、音效和基础对话。操作简单,且对提示样式具有较强的鲁棒性。该模型的出现,无疑为音频处理领域的发展注入了新的活力,...

Read More
2023-06-13 talkingdev

Audiocraft:音频处理的深度学习库

内容摘要: - Audiocraft是一个音频处理和生成的库 - 它由MusicGen驱动,是一种最先进的可控文本到音乐模型 - Audiocraft基于深度学习技术,具有强大的音频处理能力

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3