漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-22 talkingdev

Audapolis:使用转录的文本来编辑音频文件

Audapolis是一家音频编辑创业公司,他们最近推出了一项新功能,该功能可以让用户通过转录文本而不是传统的波形视图来编辑音频文件。该功能使得用户可以更加准确地编辑音频文件,而且还能够更好地理解音频的内容。Aud...

Read More
2024-07-09 talkingdev

浏览器如何隔离内部音频和麦克风输入?

近日有网友发出问题:浏览器如何隔离内部音频和麦克风输入?对此,业内专家指出,浏览器为了保护用户的隐私,会采取一系列技术手段来隔离内部音频和麦克风输入,比如使用WebRTC API(Web Real-Time Communications A...

Read More
2024-07-09 talkingdev

CD Pregap是如何获得隐蔽音轨超能力的

CD Pregap是指光盘上的音轨0,它通常用于放置隐藏的音乐曲目,因为CD播放器只会读取从第一音轨开始的音乐曲目。但是,这并不是CD Pregap的本意。实际上,Pregap是为了在CD播放器上播放其它多媒体内容而设计的,比如...

Read More
2024-07-09 talkingdev

SenseVoice开源:具有多重语音情感理解能力的基础模型

近日,GitHub发布了一款名为SenseVoice的语音基础模型。这款模型拥有多重语音理解能力,包括自动语音识别、口语语言识别、语音情感识别以及音频事件检测。自动语音识别技术可以实现对人类语音的智能理解;口语语言识...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
2024-07-04 talkingdev

法国实验室Kyutai Moshi研发出低延迟的纯音频LLM

Kyutai,一家法国的开放研究实验室,成功地训练出一款具有极低延迟的纯音频LLM。他们成功地创建了一个令人印象深刻的演示,将在未来几个月内开源。Kyutai的这项工作表明,纯音频LLM的实现并不遥不可及,只是需要在技...

Read More
2024-06-30 talkingdev

LosslessCut:无损视频/音频编辑的瑞士军刀

LosslessCut是一款免费、开源的视频/音频编辑工具,可以快速剪辑、裁剪、分离、合并视频/音频文件,而且完全不会影响文件的原始质量。它非常适用于需要快速剪辑视频/音频的人,比如YouTuber、播客、视频爱好者等等。...

Read More
2024-06-28 talkingdev

ElevenLabs首款iOS应用——AI音频阅读器上线

ElevenLabs正式发布了其首款iOS应用,名为“ElevenLabs Reader: AI Audio”。这款应用设计用于将文本文件或网页链接转换为音频讲述,用户在出行时也能听取内容。ElevenLabs Reader: AI Audio旨在提升用户的信息获取方...

Read More
2024-06-13 talkingdev

Meta推出低比特率音频编解码器 MLow

根据最新消息,Meta刚刚推出了一款全新的低比特率音频编解码器 MLow。这款编解码器可将高质量音频压缩至更小的文件大小,具有更快的加载速度和更少的带宽需求。据Meta介绍,该编解码器使用了先进的人工智能技术,可...

Read More
2024-06-06 talkingdev

Stability AI发布Stable Audio技术,可生成高品质音效

Stability AI近日在Hugging Face Hub平台上发布了Stable Audio的权重。Stable Audio是一种训练生成音效的技术,该技术基于许可音频样本进行训练。通过这一技术,用户可以生成各种高品质的音效,应用于游戏开发、电影...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page