漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-04 talkingdev

论文:深度学习助力全能音效移除系统的构建

近期,音频深度学习领域焕发新生。通过使用一个分类器,接着是特定效果的模块,我们可以构建一个全能系统,逐步从已混合的音频中移除混响或延迟等效果。这种技术不仅能够增强音频处理的效率,还能改进音频的整体质量...

Read More
2023-08-31 talkingdev

Google Pixel 8:最新泄露与传言汇总

看起来谷歌正准备迎接十月份的硬件发布会。本页面收集了关于即将发布的Pixel手机系列的泄露信息的文章。Pixel发布会定于10月4日举行。设备的更新包括改进的相机应用界面、音频魔术橡皮擦和清晰模糊视频的方法。似乎...

Read More
2023-08-29 talkingdev

AudioLDM2-声音与音乐生成模型开源

近日,一款出色的开源声音与音乐生成模型在GitHub上引发关注。这款模型运行速度快,能生成节拍、音效和基础对话。操作简单,且对提示样式具有较强的鲁棒性。该模型的出现,无疑为音频处理领域的发展注入了新的活力,...

Read More
2023-08-14 talkingdev

Racast:把你想阅读的文章转变为音频摘要

再造(Recast)是一款颠覆性的新产品,它可以将您想阅读的文章转化为丰富的音频摘要。这款产品通过先进的语音合成技术,将文字信息转化为音频,使用户可以在忙碌的日程中随时随地获取信息。无论是在通勤路上,健身房中...

Read More
2023-08-03 talkingdev

Meta发布AudioCraft:一站式生成音频需求的代码库

Meta最新发布的AudioCraft,是一款满足所有生成音频需求的一站式代码库,包括音乐、音效和压缩。AudioCraft的出现,改变了过去我们需要使用多个工具和平台才能完成的音频生成任务,现在只需要这个代码库,就能轻松完...

Read More
2023-07-27 talkingdev

免费课程揭秘音频变压器技术

近年来,使用变压器生成内容的技术日益流行,但其实这样的技术难以入门,而且更难找到相关的学习资料。好消息是,HuggingFace公司最近推出了一门极好的新课程,详细介绍了如何处理音频数据以及如何训练变压器。这门...

Read More
2023-07-26 talkingdev

OpenAI关闭AI分类器工具,难辨AI和人工写作

由于准确率低,OpenAI于7月20日关闭了其AI分类器工具。AI生成的文本可以被滥用的方式有很多,而且很难区分AI和人工工作的差异。OpenAI表示,AI分类器工具从未很好,会出现误报。该公司计划开发方法帮助用户检测音频...

Read More
2023-06-30 talkingdev

Marc Andreessen谈AI和如何改变世界的采访

a16z的联合创始人Marc Andreessen撰写了三篇重要的文章:'为什么软件正在吞噬世界'、'是时候去建设'和'为什么AI将拯救世界'。本文是一次与Andreessen进行的广泛采访的文字转录,重点关注最近关于AI的那篇文章。还讨...

Read More
2023-06-30 talkingdev

MusicGen: 简化音乐生成的一种新方法开源

Audiocraft推出MusicGen,这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示,通过并行预测所有码本,它更高效地生成音乐,从而每秒音频的步骤更少。

Read More
2023-06-29 talkingdev

Goodmeetings:AI精选会议片段,数小时会议精简为关键几分钟

Goodmeetings是一款基于人工智能的产品,可以将数小时的会议内容精选为几分钟的关键时刻。它能够自动记录会议的音频和文本,并将这些录音、文本和洞察力整理成一个易于搜索的库。用户可以通过关键词搜索会议内容,快...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page