Stable Audio Open Small开源TTS模型,可在Arm CPU上运行
talkingdev • 2025-05-15
6949 views
Stability AI近日开源了名为Stable Audio Open Small的文本转音频模型,该模型拥有3.41亿参数,专为在Arm架构的CPU上高效运行而优化。这一突破性技术使得在智能手机上生成11秒的音频片段仅需不到8秒的时间,极大地提升了移动设备上的音频生成效率。该模型的发布不仅展示了AI在音频生成领域的最新进展,也为开发者提供了在资源受限设备上实现高质量音频生成的新工具。Stability AI此次开源的举措将进一步推动AI音频技术的普及和应用,特别是在移动设备和嵌入式系统领域。这一技术的商业化潜力巨大,有望在音乐创作、游戏音效、语音合成等多个领域带来革新。
核心要点
- Stability AI开源了专为Arm CPU优化的文本转音频模型Stable Audio Open Small
- 该模型能在智能手机上8秒内生成11秒的音频片段,展示了高效性能
- 这一技术突破为移动设备和嵌入式系统的音频生成应用开辟了新可能