智能语音助手的相关内容 - 漫话开发者

2025-11-26 talkingdev

[开源]TEN框架开源：专为对话式语音AI智能体打造的全新开发平台

近日，TEN框架在GitHub平台正式开源，这是一个专门为对话式语音AI智能体设计的开源开发框架。该框架的发布标志着语音交互AI领域迎来了重要的技术突破，为开发者提供了构建复杂语音对话系统的标准化工具集。TEN框架支...

2025-08-10 talkingdev

《纽约时报》科技专栏作者Kevin Roose对亚马逊最新推出的智能语音助手Alexa+进行了深度体验。这款被寄予厚望的升级版展现出两大技术特性：采用更先进的自然语言处理架构，实现了接近人类对话的交互流畅度；在多步骤...

2025-06-20 talkingdev

一项发表于arXiv的突破性研究提出新型端到端变分编码器架构，通过自动学习韵律特征替代传统手工设计的音高输入，显著提升生成式口语语言模型的自然度表现。该技术摒弃了人工特征工程，直接对语义语音标记与韵律特征...

2025-03-17 talkingdev

最近，一项名为WSI的研究将Whisper自动语音识别（ASR）编码器重新应用于多语言说话人识别任务，通过联合损失优化技术实现了显著的性能提升。该技术在多语言和多样化环境中识别说话人时，表现优于现有主流模型如Pyann...

2024-06-26 talkingdev

研究人员已经发现，通过分类数据、预计算嵌入以及动态生成示例，可以使LLM语音助手更加高效和可扩展。他们利用RAG（Retrieval Augmented Generation）系统对语音助手进行优化，提高了其性能和扩展性。RAG是一种典型...