亚马逊发布史上最大的文本转语音AI模型,拥有“新兴能力”
talkingdev • 2024-02-15
986941 views
亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的文本转语音AI模型之一,旨在提高语音合成的质量和自然度。 BASE TTS的新兴特性使其可以根据上下文自动调整语音发音,从而产生更加自然的语音效果。除此之外,该模型还可以自我评估和自我纠正,从而不断改善语音合成的质量。目前,BASE TTS已经在Alexa等亚马逊产品中得到应用。
核心要点
- 亚马逊发布新的文本转语音模型BASE TTS,拥有980万个参数。
- 该模型具有新兴特性,可以自然地讲述复杂的句子。
- BASE TTS的新兴特性可以根据上下文自动调整语音发音,从而产生更加自然的语音效果。