人工智能初创公司Decart与语音技术领军企业ElevenLabs合作,推出开源实时唇形同步API技术。该技术通过实时音频流输入,可生成精准同步的虚拟人像视频与语音输出,支持任意语音引擎与自定义角色配置。这项突破性技术...
Read More谷歌开发者博客最新推出的Coral NPU(神经网络处理器)标志着边缘AI领域的重要突破。该平台采用全栈式开源架构,专为低功耗、持续在线的边缘计算场景设计,有效解决了当前边缘设备面临的三大核心挑战:首先,通过统...
Read More人工智能公司Anthropic正式推出新一代小型AI模型Claude Haiku 4.5,该模型在保持成本效益与运行速度优势的同时,实现了接近前沿大模型的性能表现。据官方披露,这款模型在多项基准测试中不仅超越了前代版本,更在计...
Read More传统大型语言模型(LLM)系统普遍存在硬件利用率低下的问题,主要源于GPU内核的序列化启动及跨设备通信开销。一支研究团队创新性地开发出专用编译器,可将LLM推理过程自动编译为单一megakernel(超级内核),通过三大...
Read More近日,一篇关于将大语言模型(LLMs)编译为单一MegaKernel以实现低延迟推理的技术文章引发广泛讨论。该技术通过优化编译器设计,将传统需要多个内核调用的LLM推理过程整合为高度融合的单一内核,显著减少了内核启动...
Read More在机器人技术领域,实时性至关重要——输入与输出之间的延迟会直接影响机器人的性能表现。尽管视觉-语言-动作(VLA)模型在开放世界泛化方面取得了令人瞩目的成果,但其运行速度往往较慢。近日,一项名为“实时分块”的...
Read MoreGroq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商,这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构,开发者能够以服务器无感知(serverless)方式极速调用Llama...
Read MoreAnam最新发布的AI技术标志着人机交互的重大突破,其开发的实时AI角色系统能够以高度拟人化的方式处理客户支持、学习与发展(L&D)以及各类业务咨询。该技术通过轻量级SDK实现快速部署,支持嵌入任何应用程序,显著提...
Read More