Meta旗下Facebook Research团队在GitHub开源了Omnilingual ASR多语言语音识别系统,这项突破性技术首次实现对全球1600余种语言的语音转文本支持,其中数百种语言是现有ASR技术从未覆盖的濒危语种。该系统采用创新的...
Read MoreMeta近日发布了名为'全语种自动语音识别'(Omnilingual Automatic Speech Recognition)的AI模型套件,这项突破性技术将自动语音识别能力扩展到1600多种语言,覆盖全球绝大多数已知语言体系。该系统的核心创新在于其...
Read More根据麦肯锡最新发布的AI年度报告,当前大多数企业仍处于人工智能技术的实验性探索或试点应用阶段。值得注意的是,行业领先企业正通过AI技术实现三重突破:驱动业务增长引擎、构建创新产品生态、优化运营成本结构。报...
Read More中国人工智能实验室月之暗面(Moonshot AI)近日开源其革命性推理模型Kimi K2,在关键基准测试中展现出与国际顶尖模型的竞争实力。该模型在衡量综合认知能力的‘人类终极考试’(Humanity's Last Exam)中取得44.9%的...
Read More通义DeepResearch作为全新开源的Web智能体,在综合基准测试中展现出与OpenAI DeepResearch相媲美的性能水平。该项目专为解决长周期、深层次信息检索任务而设计,通过模块化架构实现了对复杂研究流程的自动化处理。其...
Read More近日,GitHub开源项目Dexto引发开发者社区广泛关注。作为专为AI智能体设计的智能层框架,Dexto通过协调大语言模型、工具链与数据源,将自然语言指令转化为可执行动作。其核心价值在于提供配置驱动的开发范式,支持命...
Read More人工智能初创公司Decart与语音技术领军企业ElevenLabs合作,推出开源实时唇形同步API技术。该技术通过实时音频流输入,可生成精准同步的虚拟人像视频与语音输出,支持任意语音引擎与自定义角色配置。这项突破性技术...
Read MoreAnthropic研究团队在《Circuits Updates – October 2025》中披露了令人振奋的发现:其大型语言模型Claude的内部神经元展现出跨模态理解能力。实验表明,当模型处理文字“眼睛”时激活的特定神经元,在遇到用@符号排列...
Read More