开源|Ghost Pepper:macOS本地长按语音转文字工具,基于WhisperKit与本地LLM,数据不出设备
talkingdev • 2026-04-07
2685 views
开发者matthartman近日在GitHub上开源了名为Ghost Pepper的macOS应用,它是一款完全在本地运行的“长按说话”语音转文字工具。该工具的核心技术栈结合了OpenAI开源的WhisperKit语音识别模型与本地运行的大型语言模型(LLM)进行后处理优化,确保所有音频数据的录制、识别与文本生成均在用户设备上完成,实现了“数据零外传”的隐私保护承诺。用户只需按住Control键即可开始录音,松开后系统自动完成转录,并将结果直接粘贴到当前焦点窗口,极大提升了编码、邮件撰写等场景的输入效率。该项目采用MIT开源协议,作者表示已将其广泛应用于编程和邮件处理,并正探索将其作为语音接口与其他AI智能体集成。该工具的出现,顺应了当前边缘计算与隐私优先的技术趋势,为追求数据安全与低延迟交互的用户提供了一个高性能的本地化解决方案。
核心要点
- 完全本地化运行,基于WhisperKit与本地LLM,确保语音数据不离开用户计算机,保障隐私安全。
- 采用“长按控制键录音,松开即转录并粘贴”的直观交互模式,旨在提升编码、写作等场景的输入效率。
- 项目以MIT协议开源,作者正探索将其作为语音接口集成到其他AI代理中,并欢迎社区反馈与贡献。