漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-07 talkingdev

开源|ElevenLabs发布React Native SDK,快速集成交互式语音代理

ElevenLabs近日发布了针对React Native的Conversational AI SDK,该工具允许开发者在React Native应用中快速集成高度定制化的交互式语音代理。这一SDK的推出将显著降低语音交互功能的开发门槛,开发者只需满足React...

Read More
2025-07-30 talkingdev

ElevenLabs推出新CLI工具,简化对话式AI代理开发流程

ElevenLabs近日发布了一款创新的命令行界面(CLI)工具,该工具允许开发者将对话式AI代理作为代码进行管理。这一突破性工具为语音和聊天代理工作流带来了版本控制、自动化部署和环境一致性等关键功能。该CLI工具支持多...

Read More
2025-07-09 talkingdev

NotebookLLaMa:基于LlamaCloud的开源替代方案

NotebookLLaMa是一个完全开源的项目,旨在提供NotebookLM的替代方案。该项目利用LlamaCloud进行文档处理,结合OpenAI的内容生成能力和ElevenLabs的语音合成技术,构建了一个功能强大的知识管理平台。作为开源社区的...

Read More
2025-06-25 talkingdev

ElevenLabs推出个人AI语音助手11.ai,集成多平台工作流

人工智能语音技术公司ElevenLabs近日发布了名为11.ai的个人AI语音助手,该产品以其低延迟特性脱颖而出,并深度整合了Perplexity、Linear、Slack和Notion等主流生产力平台。通过MCP(多通道处理)集成技术,11.ai能够...

Read More
2025-05-14 talkingdev

Audible联手出版商扩展AI有声读物库,支持多语言合成

亚马逊旗下有声书服务平台Audible正与多家出版商合作,通过AI语音合成技术大幅扩充其有声读物资源库。该平台目前已集成超过100种AI语音,支持英语、西班牙语、法语和意大利语等多种语言的自动播讲。这一举措标志着数...

Read More
2025-04-28 talkingdev

开源AI模型Dia-1.6B:以小体积实现超越巨头的情绪语音合成

Nari Labs最新发布的Dia-1.6B开源AI模型在情绪语音合成领域取得突破性进展。这款仅1.6B参数的微型模型在测试中展现出超越ElevenLabs和Sesame等行业领导者的表现,尤其擅长模拟极端情绪状态,如歇斯底里的恐怖尖叫。...

Read More
2025-02-27 talkingdev

ElevenLabs推出高精度多语言转录模型Scribe,支持99种语言

ElevenLabs近日宣布推出其自主研发的转录模型Scribe,该模型支持99种语言,并具备高精度转录能力。Scribe不仅提供词级时间戳和说话人分离功能,还能适应真实世界中的各种音频环境。这一技术的推出将极大提升语音转文...

Read More
2024-06-28 talkingdev

ElevenLabs首款iOS应用——AI音频阅读器上线

ElevenLabs正式发布了其首款iOS应用,名为“ElevenLabs Reader: AI Audio”。这款应用设计用于将文本文件或网页链接转换为音频讲述,用户在出行时也能听取内容。ElevenLabs Reader: AI Audio旨在提升用户的信息获取方...

Read More
  1. Next Page