语音AI的相关内容 - 漫话开发者

2025-11-26 talkingdev

[开源]TEN框架开源：专为对话式语音AI智能体打造的全新开发平台

近日，TEN框架在GitHub平台正式开源，这是一个专门为对话式语音AI智能体设计的开源开发框架。该框架的发布标志着语音交互AI领域迎来了重要的技术突破，为开发者提供了构建复杂语音对话系统的标准化工具集。TEN框架支...

2025-08-07 talkingdev

ElevenLabs近日发布了针对React Native的Conversational AI SDK，该工具允许开发者在React Native应用中快速集成高度定制化的交互式语音代理。这一SDK的推出将显著降低语音交互功能的开发门槛，开发者只需满足React...

2025-07-16 talkingdev

Mistral AI近日发布了其首个开源音频模型套件Voxtral，标志着开源语音理解技术迈入新阶段。该套件包含两个关键版本：24B参数的大规模应用模型和3B参数的边缘计算优化版本。24B模型凭借庞大参数规模，可处理复杂语音...

2025-07-08 talkingdev

Rime公司近日推出了市场上最逼真、最具表现力的AI语音技术，能够创造出听起来像普通人而非机器人或配音演员的智能语音体验。这一技术不仅显著提升了用户体验，还为像达美乐这样的品牌带来了两位数的转化率增长。Rime...

2024-02-15 talkingdev

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities（BASE TTS），该模型拥有980万个参数，并具有新兴特性，可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

2023-09-20 talkingdev

全球最强大的语音转文本(STT)模型Nova-2已经来临。相较于其他选项，Deepgram的Nova-2提供了下一级的准确度和极速的速度，使得语音AI功能的快速实现成为可能。如果你想了解更多信息或者开始使用，现在注册就可以获得2...

2023-06-23 talkingdev

声音技术研究公司ElevenLabs已经完成1900万美元的A轮融资，用于继续进行语音AI研究和产品部署，这是其使所有内容普遍可访问的使命的一部分。该轮融资由Nat Friedman、Daniel Gross和Andreessen Horowitz领投。该产品...