TTS的相关内容 - 漫话开发者

2024-06-12 talkingdev

Coqui.ai TTS：一款用于文本转语音的深度学习工具包

Coqui.ai TTS是一款用于文本转语音的深度学习工具包，它支持多种语言和声音风格，并可在较低的计算资源上实现高质量的语音合成。该工具包基于TensorFlow 2和PyTorch，是一款开源、易于使用的工具，可帮助研究人员和...

2024-03-25 talkingdev

DeepGram公司近日推出了一项名为Aura的创新产品，这是一款文本转语音（TTS）API，其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈，极大提升了交互...

2024-02-22 talkingdev

亚马逊AGI研究人员开发了一种名为“具有新兴能力的大适应流式TTS”（BASE TTS）的语言模型，它在对话文本中表现出“最先进的自然度”，展示了它没有专门训练的语言技能。

2024-02-15 talkingdev

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities（BASE TTS），该模型拥有980万个参数，并具有新兴特性，可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

2024-01-22 talkingdev

Tiny Narrations是一个基于最受欢迎的Tiny Stories数据集的文本转语音版本。它使用SF Compute H100集群上的XTTS2。这个系统可以将短小精悍的故事转化为音频文件，方便用户在不同场景下收听。这个系统的优点是使用了...

2024-01-16 talkingdev

最近，一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo，它使用GPT4-V和最先进的文本转语音技术，加上一些屏幕录制软件，可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

2023-11-21 talkingdev

StyleTTS 2是一款文本转语音模型，旨在通过将风格扩散和对抗训练与大型语音语言模型相结合来实现接近人类水平的语音合成。StyleTTS 2是在原有StyleTTS模型的基础上进一步优化，采用了更加先进的多任务学习技术，使得...

2023-09-15 talkingdev

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数，并能进行多语种的合成。此项技术的出现，无疑是对人工智能领域的一大贡献，预计将在语音合成、语音识别等多个应用领域发挥巨...