漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-06 talkingdev

AI沟通教练Yoodli完成4000万美元B轮融资,估值突破3亿美元

总部位于西雅图的AI沟通训练软件公司Yoodli近日宣布完成4000万美元的B轮融资,本轮融资由WestBridge Capital领投,公司投后估值已超过3亿美元,较之前估值增长逾两倍。Yoodli由前谷歌工程师创立,其核心产品是一款基...

Read More
2025-11-11 talkingdev

开源|Meta发布Omnilingual ASR,支持1600+语言的语音识别技术

Meta旗下Facebook Research团队在GitHub开源了Omnilingual ASR多语言语音识别系统,这项突破性技术首次实现对全球1600余种语言的语音转文本支持,其中数百种语言是现有ASR技术从未覆盖的濒危语种。该系统采用创新的...

Read More
2025-11-11 talkingdev

Meta推出全语种自动语音识别系统,支持超1600种语言

Meta近日发布了名为'全语种自动语音识别'(Omnilingual Automatic Speech Recognition)的AI模型套件,这项突破性技术将自动语音识别能力扩展到1600多种语言,覆盖全球绝大多数已知语言体系。该系统的核心创新在于其...

Read More
2025-10-01 talkingdev

开源|Handy:完全离线的开源语音转文字工具,支持跨平台与自定义快捷键

近期在GitHub上开源的Handy项目,是一款完全离线运行的跨平台语音转文字应用,其技术核心基于OpenAI的Whisper模型及NVIDIA的Parakeet模型实现本地化语音识别。这一设计突破了传统语音工具对云端服务的依赖,在隐私保...

Read More
2025-09-28 talkingdev

开源|Handy:基于Rust开发的免费开源跨平台语音转文本应用

近日,一款名为Handy的开源语音识别应用在技术社区引发关注。这款采用Rust语言编写的跨平台工具,实现了高效的实时语音转文本功能,其开源特性允许开发者自由查看和修改源代码。Handy支持Windows、macOS和Linux三大...

Read More
2025-09-05 talkingdev

对话式AI公司Cerence在德州起诉苹果专利侵权,涉及虚拟键盘与“Hey Siri”技术

美国对话式人工智能技术公司Cerence近日在德克萨斯州联邦法院对苹果公司提起专利侵权诉讼,指控苹果的虚拟键盘功能和“Hey Siri”语音唤醒技术侵犯其多项核心专利。诉状显示,涉案专利涵盖智能输入预测、上下文感知文...

Read More
2025-08-31 talkingdev

语音识别技术新应用:用简短独特单词替代姓名预订团体餐桌,社交聚会效率提升新方案

近日,Reddit社区分享的一项创新方法展示了语音识别技术在日常生活场景中的巧妙应用。用户建议在预订团体餐桌时使用简短、易识别且拼写简单的独特单词(如'Sunfish'或'Maple')替代个人姓名进行登记。该方法通过提前...

Read More
2025-08-19 talkingdev

开源|Whispering:本地优先、数据透明的语音转文本工具

Whispering是一款基于开源协议的语音转文本(Speech-to-Text)应用程序,其核心设计理念强调“本地优先”和“数据透明化”。该工具允许用户通过快捷键快速启动语音转录,并支持自主选择云端或本地计算资源进行处理,无需...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page