ElevenLabs的相关内容 - 漫话开发者

2025-10-28 talkingdev

Decart推出实时唇形同步API：打造会说话的虚拟数字人

人工智能初创公司Decart与语音技术领军企业ElevenLabs合作，推出开源实时唇形同步API技术。该技术通过实时音频流输入，可生成精准同步的虚拟人像视频与语音输出，支持任意语音引擎与自定义角色配置。这项突破性技术...

2025-08-07 talkingdev

ElevenLabs近日发布了针对React Native的Conversational AI SDK，该工具允许开发者在React Native应用中快速集成高度定制化的交互式语音代理。这一SDK的推出将显著降低语音交互功能的开发门槛，开发者只需满足React...

2025-07-30 talkingdev

ElevenLabs近日发布了一款创新的命令行界面(CLI)工具，该工具允许开发者将对话式AI代理作为代码进行管理。这一突破性工具为语音和聊天代理工作流带来了版本控制、自动化部署和环境一致性等关键功能。该CLI工具支持多...

2025-07-09 talkingdev

NotebookLLaMa是一个完全开源的项目，旨在提供NotebookLM的替代方案。该项目利用LlamaCloud进行文档处理，结合OpenAI的内容生成能力和ElevenLabs的语音合成技术，构建了一个功能强大的知识管理平台。作为开源社区的...

2025-06-25 talkingdev

人工智能语音技术公司ElevenLabs近日发布了名为11.ai的个人AI语音助手，该产品以其低延迟特性脱颖而出，并深度整合了Perplexity、Linear、Slack和Notion等主流生产力平台。通过MCP（多通道处理）集成技术，11.ai能够...

2025-05-14 talkingdev

亚马逊旗下有声书服务平台Audible正与多家出版商合作，通过AI语音合成技术大幅扩充其有声读物资源库。该平台目前已集成超过100种AI语音，支持英语、西班牙语、法语和意大利语等多种语言的自动播讲。这一举措标志着数...

2025-04-28 talkingdev

Nari Labs最新发布的Dia-1.6B开源AI模型在情绪语音合成领域取得突破性进展。这款仅1.6B参数的微型模型在测试中展现出超越ElevenLabs和Sesame等行业领导者的表现，尤其擅长模拟极端情绪状态，如歇斯底里的恐怖尖叫。...

2025-02-27 talkingdev

ElevenLabs近日宣布推出其自主研发的转录模型Scribe，该模型支持99种语言，并具备高精度转录能力。Scribe不仅提供词级时间戳和说话人分离功能，还能适应真实世界中的各种音频环境。这一技术的推出将极大提升语音转文...