语音识别的相关内容 - 漫话开发者

2025-09-28 talkingdev

开源|Handy：基于Rust开发的免费开源跨平台语音转文本应用

近日，一款名为Handy的开源语音识别应用在技术社区引发关注。这款采用Rust语言编写的跨平台工具，实现了高效的实时语音转文本功能，其开源特性允许开发者自由查看和修改源代码。Handy支持Windows、macOS和Linux三大...

2025-09-05 talkingdev

美国对话式人工智能技术公司Cerence近日在德克萨斯州联邦法院对苹果公司提起专利侵权诉讼，指控苹果的虚拟键盘功能和“Hey Siri”语音唤醒技术侵犯其多项核心专利。诉状显示，涉案专利涵盖智能输入预测、上下文感知文...

2025-08-31 talkingdev

近日，Reddit社区分享的一项创新方法展示了语音识别技术在日常生活场景中的巧妙应用。用户建议在预订团体餐桌时使用简短、易识别且拼写简单的独特单词（如'Sunfish'或'Maple'）替代个人姓名进行登记。该方法通过提前...

2025-08-19 talkingdev

Whispering是一款基于开源协议的语音转文本（Speech-to-Text）应用程序，其核心设计理念强调“本地优先”和“数据透明化”。该工具允许用户通过快捷键快速启动语音转录，并支持自主选择云端或本地计算资源进行处理，无需...

2025-07-24 talkingdev

Voxtral团队最新发布了Voxtral Mini和Voxtral Small两款多模态音频聊天模型，在语音理解和文本处理方面均达到业界领先水平。这两款模型能够同时处理语音音频和文本文档，在多项音频基准测试中取得了最先进的性能表现...

2025-07-07 talkingdev

Character.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型，仅需单张静态图像和语音输入，即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...

2025-06-17 talkingdev

Retellio作为新一代销售智能分析平台，通过AI技术实时解析销售通话内容，自动提取关键客户洞察，并以播客、新闻简报或Slack消息等多样化形式输出。该平台采用先进的自然语言处理（NLP）和语音识别技术，能够精准捕捉...

2025-05-14 talkingdev

人工智能平台Hugging Face近日发布了一项突破性的语音转录服务——Whisper极速端点（Fast Whisper Endpoint）。这项创新技术通过优化模型架构和计算资源分配，实现了高达8倍的转录速度提升，为语音处理领域树立了新的...