漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-11 talkingdev

开源|RCLI:完全本地的macOS语音AI助手,无需云端即可控制电脑与文档问答

近日,GitHub上开源项目RCLI引发开发者社区关注。该项目是一款专为搭载Apple Silicon芯片的macOS设备设计的全本地化语音AI助手。其核心价值在于构建了一个完整的端侧AI处理流水线,集成了语音识别(Speech-to-Text)...

Read More
2026-03-11 talkingdev

开源|RCLI:本地化语音AI助手登陆macOS,无需云端即可控制应用与查询文档

近日,GitHub开源项目RCLI(RunanywhereAI/RCLI)发布,为macOS用户带来了一款完全在设备端运行的语音人工智能助手。该工具的核心创新在于其“全本地化”架构,集成了本地语音AI与检索增强生成(RAG)技术,用户可直接...

Read More
2026-03-03 talkingdev

开源|从零打造亚500毫秒延迟语音助手:技术架构与关键洞察

开发者Nick Tikhonov近日开源了一个名为“shuo”的语音助手项目,其端到端平均延迟仅为约400毫秒(从用户停止说话到助手发出第一个音节)。这一性能指标在集成了完整的语音识别(STT)、大语言模型(LLM)和语音合成(...

Read More
2026-02-17 talkingdev

开源|FreeFlow:对标Wispr Flow与Superwhisper的开源实时语音转写替代方案

近日,开发者Zach Latta在GitHub上发布了名为FreeFlow的开源项目,旨在为市场上流行的实时语音转写服务(如Wispr Flow、Superwhisper、Monologue等)提供一个免费且开源的替代方案。该项目在Hacker News社区引发了广...

Read More
2026-01-09 talkingdev

开源|Sopro TTS:仅1.69亿参数,支持零样本语音克隆的轻量级CPU端模型

近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...

Read More
2025-12-18 talkingdev

xAI开放Grok语音代理API,成本仅为OpenAI Realtime API一半

埃隆·马斯克旗下的人工智能公司xAI近日宣布,将向所有开发者开放其驱动特斯拉汽车内Grok语音助手的语音技术栈。这一举措标志着xAI正加速其尖端AI技术的商业化与生态构建。新开放的Grok Voice Agent API在性能与成本...

Read More
2025-11-26 talkingdev

[开源]TEN框架开源:专为对话式语音AI智能体打造的全新开发平台

近日,TEN框架在GitHub平台正式开源,这是一个专门为对话式语音AI智能体设计的开源开发框架。该框架的发布标志着语音交互AI领域迎来了重要的技术突破,为开发者提供了构建复杂语音对话系统的标准化工具集。TEN框架支...

Read More
2025-10-12 talkingdev

Foundation Health完成2000万美元A轮融资,AI助手革新药房患者沟通与授权流程

医疗科技初创公司Foundation Health近日宣布完成2000万美元A轮融资,该公司专注于开发人工智能助手,旨在自动化药房的患者沟通和事前授权工作流程。这项技术通过AI语音助手和智能流程自动化,能够显著提升专科药房和...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page