文本转语音的相关内容 - 漫话开发者

2026-01-09 talkingdev

开源|Sopro TTS：仅1.69亿参数，支持零样本语音克隆的轻量级CPU端模型

近日，GitHub上开源了一个名为Sopro的轻量级文本转语音（TTS）模型，其核心亮点在于仅包含1.69亿参数，却实现了零样本语音克隆能力，并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布，迅速在技术社区引...

2025-12-18 talkingdev

近日，由Resemble AI团队在GitHub上开源了名为Chatterbox的文本转语音模型，标志着开源TTS领域迈入了一个新的技术高度。该项目被定位为当前最先进的开源TTS解决方案，其核心亮点在于集成了多语言支持、精细化的情感...

2025-07-11 talkingdev

开发者Henry和Roman近日推出开源项目Cactus，这是一个专为智能手机设计的跨平台框架，支持本地部署大型语言模型（LLM）、视觉语言模型（VLM）和文本转语音（TTS）模型。与Ollama专注于笔记本和边缘服务器不同，Cactu...

2025-07-08 talkingdev

Rime公司近日推出了市场上最逼真、最具表现力的AI语音技术，能够创造出听起来像普通人而非机器人或配音演员的智能语音体验。这一技术不仅显著提升了用户体验，还为像达美乐这样的品牌带来了两位数的转化率增长。Rime...

2025-07-04 talkingdev

法国研究机构Kyutai Labs近日开源其文本转语音（TTS）系统Kyutai TTS，该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现，达到行业领先水平。系统创新性地提供单词级时间戳输出功能，英语和法语的字错误...

2025-05-06 talkingdev

近日，GitHub上开源了一个名为VoiceStar的文本转语音（TTS）模型，该模型在零样本语音克隆和情感表达控制方面展现出显著优势。VoiceStar能够通过极少的样本数据实现高质量的语音克隆，这意味着用户只需提供几秒钟的...

2025-04-22 talkingdev

近日，一款名为Dia的开源权重TTS（文本转语音）模型正式亮相，专注于生成高度拟真的对话语音。Dia作为开放权重的技术项目，允许开发者自由访问和调整模型参数，为语音合成领域提供了新的工具选择。该模型通过优化对...

2025-04-01 talkingdev

开源项目Orpheus近期引发开发者社区关注，该项目通过C++实现了一个高效易用的文本转语音(TTS)系统。与Llama.cpp类似，其最大技术亮点在于完全脱离GPU依赖，仅需简单安装即可在普通计算设备上运行，显著降低了语音合...