漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-11 talkingdev

开源|RCLI:完全本地的macOS语音AI助手,无需云端即可控制电脑与文档问答

近日,GitHub上开源项目RCLI引发开发者社区关注。该项目是一款专为搭载Apple Silicon芯片的macOS设备设计的全本地化语音AI助手。其核心价值在于构建了一个完整的端侧AI处理流水线,集成了语音识别(Speech-to-Text)...

Read More
2026-03-03 talkingdev

开源|从零打造亚500毫秒延迟语音助手:技术架构与关键洞察

开发者Nick Tikhonov近日开源了一个名为“shuo”的语音助手项目,其端到端平均延迟仅为约400毫秒(从用户停止说话到助手发出第一个音节)。这一性能指标在集成了完整的语音识别(STT)、大语言模型(LLM)和语音合成(...

Read More
2026-02-25 talkingdev

开源|Moonshine开源语音识别模型:边缘设备上的STT精度超越WhisperLargev3

一家名为Moonshine AI的小型初创公司(团队仅六人,月GPU预算低于10万美元)近日在GitHub上开源了其自动语音识别(ASR)项目Moonshine。该项目针对边缘设备优化,提供了快速且高精度的语音转文本(STT)模型。据开发...

Read More
2026-02-17 talkingdev

开源|FreeFlow:对标Wispr Flow与Superwhisper的开源实时语音转写替代方案

近日,开发者Zach Latta在GitHub上发布了名为FreeFlow的开源项目,旨在为市场上流行的实时语音转写服务(如Wispr Flow、Superwhisper、Monologue等)提供一个免费且开源的替代方案。该项目在Hacker News社区引发了广...

Read More
2026-02-10 talkingdev

开源|Transformers.js v4预览版发布:WebGPU加速,JavaScript生态迎来原生AI推理新纪元

人工智能开源社区Hugging Face近日在NPM上发布了Transformers.js v4的预览版本,标志着在Web端及JavaScript生态系统中部署和运行机器学习模型的能力迈入了新的阶段。Transformers.js的核心价值在于允许开发者直接在...

Read More
2026-01-30 talkingdev

苹果收购以色列AI初创公司Q.ai,强化音频AI技术护城河

苹果公司近日完成了对以色列初创公司Q.ai的收购,此举旨在强化其在人工智能音频处理领域的技术储备。Q.ai专注于成像与机器学习技术,尤其在两大前沿方向拥有核心专长:一是实现设备对“耳语”等极低音量语音的精准识别...

Read More
2025-12-23 talkingdev

图解Transformer经典:让复杂架构一目了然

一篇题为《图解Transformer》的技术博客在开发者社区Hacker News上引发了广泛关注,该博客由jalammar撰写,通过大量直观的图示和清晰的解释,深入浅出地剖析了Transformer这一革命性神经网络架构的核心工作原理。Tra...

Read More
2025-12-06 talkingdev

AI沟通教练Yoodli完成4000万美元B轮融资,估值突破3亿美元

总部位于西雅图的AI沟通训练软件公司Yoodli近日宣布完成4000万美元的B轮融资,本轮融资由WestBridge Capital领投,公司投后估值已超过3亿美元,较之前估值增长逾两倍。Yoodli由前谷歌工程师创立,其核心产品是一款基...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page