语音技术的相关内容 - 漫话开发者

2024-04-10 talkingdev

谷歌Vids应用：重塑工作生产力的下一代视频工具

谷歌近日推出了一款名为Vids的创新应用，旨在为企业工作带来全新的协作式共享视频制作体验。这款应用的设计理念是让制作视频变得和制作幻灯片一样简单，无需视频制作经验。用户可以在应用内整理素材并进行编辑，最终...

2024-03-25 talkingdev

DeepGram公司近日推出了一项名为Aura的创新产品，这是一款文本转语音（TTS）API，其最引人注目的特性是拥有低于250毫秒的响应延迟时间。这一技术突破意味着用户可以在实时应用中获得更快的语音反馈，极大提升了交互...

2024-02-15 talkingdev

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities（BASE TTS），该模型拥有980万个参数，并具有新兴特性，可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

2024-02-09 talkingdev

这些文本转语音模型由Stability AI开发，可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集，因此其创作者合成注释了大量的语音语料库进行训练。这是注释，上字幕和训练生成模型...

2024-02-08 talkingdev

Meta Voice 是一个小而强大的文本到语音模型，支持生成和语音克隆。该模型基于深度神经网络和自回归模型，可用于多种应用场景，如语音合成、语音助手等。此外，Meta Voice 还支持多种语言，包括英语、中文、日语等。...

2024-01-16 talkingdev

最近，一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo，它使用GPT4-V和最先进的文本转语音技术，加上一些屏幕录制软件，可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

2023-12-22 talkingdev

近日，WhisperPlus正式发布。据悉，该开源项目采用了先进的语音转文字处理技术，能够实现高质量、高准确性的语音转文字功能。此外，该项目还支持多种语言和方言，可广泛应用于语音转写、智能客服等领域。WhisperPlus...

2023-11-20 talkingdev

微软在2023年的Microsoft Ignite活动上推出了Azure AI语音文本转换成语音化身，使用户可以使用文本转语音技术创建能够以多种语言说出预设文本的逼真化身。深度伪造技术是一种利用人工智能技术生成逼真但是虚假的视频...