语音助手的相关内容 - 漫话开发者

2026-01-09 talkingdev

开源|Sopro TTS：仅1.69亿参数，支持零样本语音克隆的轻量级CPU端模型

近日，GitHub上开源了一个名为Sopro的轻量级文本转语音（TTS）模型，其核心亮点在于仅包含1.69亿参数，却实现了零样本语音克隆能力，并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布，迅速在技术社区引...

2025-12-18 talkingdev

埃隆·马斯克旗下的人工智能公司xAI近日宣布，将向所有开发者开放其驱动特斯拉汽车内Grok语音助手的语音技术栈。这一举措标志着xAI正加速其尖端AI技术的商业化与生态构建。新开放的Grok Voice Agent API在性能与成本...

2025-11-26 talkingdev

近日，TEN框架在GitHub平台正式开源，这是一个专门为对话式语音AI智能体设计的开源开发框架。该框架的发布标志着语音交互AI领域迎来了重要的技术突破，为开发者提供了构建复杂语音对话系统的标准化工具集。TEN框架支...

2025-10-12 talkingdev

医疗科技初创公司Foundation Health近日宣布完成2000万美元A轮融资，该公司专注于开发人工智能助手，旨在自动化药房的患者沟通和事前授权工作流程。这项技术通过AI语音助手和智能流程自动化，能够显著提升专科药房和...

2025-08-10 talkingdev

《纽约时报》科技专栏作者Kevin Roose对亚马逊最新推出的智能语音助手Alexa+进行了深度体验。这款被寄予厚望的升级版展现出两大技术特性：采用更先进的自然语言处理架构，实现了接近人类对话的交互流畅度；在多步骤...

2025-06-25 talkingdev

人工智能语音技术公司ElevenLabs近日发布了名为11.ai的个人AI语音助手，该产品以其低延迟特性脱颖而出，并深度整合了Perplexity、Linear、Slack和Notion等主流生产力平台。通过MCP（多通道处理）集成技术，11.ai能够...

2025-06-20 talkingdev

一项发表于arXiv的突破性研究提出新型端到端变分编码器架构，通过自动学习韵律特征替代传统手工设计的音高输入，显著提升生成式口语语言模型的自然度表现。该技术摒弃了人工特征工程，直接对语义语音标记与韵律特征...

2025-05-14 talkingdev

知名创业孵化器Y Combinator近日公布了其2025年夏季的重点投资方向，聚焦于能够替代或增强传统行业角色的AI智能体技术。根据官方发布的投资主题清单，YC将重点关注语音助手、医疗健康自动化、个性化教育辅导以及赋能...