Meta推出全语种自动语音识别系统,支持超1600种语言
talkingdev • 2025-11-11
6855 views
Meta近日发布了名为'全语种自动语音识别'(Omnilingual Automatic Speech Recognition)的AI模型套件,这项突破性技术将自动语音识别能力扩展到1600多种语言,覆盖全球绝大多数已知语言体系。该系统的核心创新在于其独特的架构设计,允许开发者通过零样本上下文学习(zero-shot in-context learning)功能,无需额外训练即可将语言支持扩展到数千种更小众的语言。这一技术突破对濒危语言保护具有重要意义,同时为全球多语言互联网服务提供了基础设施支持。作为开源AI战略的重要实践,该模型套件遵循开放科学原则,预计将推动语音技术在教育、医疗、商业等领域的普惠应用。该系统的发布也标志着多模态AI技术在处理低资源语言方面取得重大进展,为构建真正全球化的数字生态奠定技术基础。