开发者Henry和Roman近日推出开源项目Cactus,这是一个专为智能手机设计的跨平台框架,支持本地部署大型语言模型(LLM)、视觉语言模型(VLM)和文本转语音(TTS)模型。与Ollama专注于笔记本和边缘服务器不同,Cactu...
Read MoreRime公司近日推出了市场上最逼真、最具表现力的AI语音技术,能够创造出听起来像普通人而非机器人或配音演员的智能语音体验。这一技术不仅显著提升了用户体验,还为像达美乐这样的品牌带来了两位数的转化率增长。Rime...
Read More法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...
Read More近日,GitHub上开源了一个名为VoiceStar的文本转语音(TTS)模型,该模型在零样本语音克隆和情感表达控制方面展现出显著优势。VoiceStar能够通过极少的样本数据实现高质量的语音克隆,这意味着用户只需提供几秒钟的...
Read More近日,一款名为Dia的开源权重TTS(文本转语音)模型正式亮相,专注于生成高度拟真的对话语音。Dia作为开放权重的技术项目,允许开发者自由访问和调整模型参数,为语音合成领域提供了新的工具选择。该模型通过优化对...
Read More开源项目Orpheus近期引发开发者社区关注,该项目通过C++实现了一个高效易用的文本转语音(TTS)系统。与Llama.cpp类似,其最大技术亮点在于完全脱离GPU依赖,仅需简单安装即可在普通计算设备上运行,显著降低了语音合...
Read More近日,一款轻量级的自回归流式文本转语音模型在GitHub上发布。该模型仅包含3000万参数,能够与任何语言模型(LLM)结合,使其具备理解和生成语音的能力,以响应通用查询。这一技术的核心优势在于,它无需对底层模型...
Read MorePlay 3.0 mini是一款轻量级的多语种文本转语音(TTS)模型,专为追求成本效益和可靠性的用户设计。该模型在多个语言之间提供高质量的语音输出,适用于各种应用场景,从教育到娱乐,兼具灵活性和实用性。Play 3.0 min...
Read More