漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-25 talkingdev

DeepGram推出Aura:实现低于250毫秒的低延迟文本转语音API

DeepGram公司近日推出了一项名为Aura的创新产品,这是一款文本转语音(TTS)API,其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈,极大提升了交互...

Read More
2024-02-15 talkingdev

亚马逊发布史上最大的文本转语音AI模型,拥有“新兴能力”

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

Read More
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-02-08 talkingdev

MetaVoice-开源13亿文本到语音模型

Meta Voice 是一个小而强大的文本到语音模型,支持生成和语音克隆。该模型基于深度神经网络和自回归模型,可用于多种应用场景,如语音合成、语音助手等。此外,Meta Voice 还支持多种语言,包括英语、中文、日语等。...

Read More
2024-01-16 talkingdev

AutoNarrate开源:用GPT4-V和TTS自动记录生活

最近,一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo,它使用GPT4-V和最先进的文本转语音技术,加上一些屏幕录制软件,可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

Read More
2023-12-22 talkingdev

WhisperPlus,高质量语音转文字技术开源

近日,WhisperPlus正式发布。据悉,该开源项目采用了先进的语音转文字处理技术,能够实现高质量、高准确性的语音转文字功能。此外,该项目还支持多种语言和方言,可广泛应用于语音转写、智能客服等领域。WhisperPlus...

Read More
2023-11-20 talkingdev

微软推出深度伪造技术生成器

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身,使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频...

Read More
2023-04-21 talkingdev

Bark推出基于文本提示的生成音频模型

新闻内容: Bark公司推出了一种基于文本提示的生成音频模型,可以将简短的文字描述转换成高质量的语音音频。该模型的核心特点如下: - 基于深度学习技术,可以自动将文本转换成声音。 - 可以根据用户的需求,自由...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3