实时AI的相关内容 - 漫话开发者

2025-10-28 talkingdev

Decart推出实时唇形同步API：打造会说话的虚拟数字人

人工智能初创公司Decart与语音技术领军企业ElevenLabs合作，推出开源实时唇形同步API技术。该技术通过实时音频流输入，可生成精准同步的虚拟人像视频与语音输出，支持任意语音引擎与自定义角色配置。这项突破性技术...

2025-10-20 talkingdev

谷歌开发者博客最新推出的Coral NPU（神经网络处理器）标志着边缘AI领域的重要突破。该平台采用全栈式开源架构，专为低功耗、持续在线的边缘计算场景设计，有效解决了当前边缘设备面临的三大核心挑战：首先，通过统...

2025-10-16 talkingdev

人工智能公司Anthropic正式推出新一代小型AI模型Claude Haiku 4.5，该模型在保持成本效益与运行速度优势的同时，实现了接近前沿大模型的性能表现。据官方披露，这款模型在多项基准测试中不仅超越了前代版本，更在计...

2025-06-20 talkingdev

传统大型语言模型(LLM)系统普遍存在硬件利用率低下的问题，主要源于GPU内核的序列化启动及跨设备通信开销。一支研究团队创新性地开发出专用编译器，可将LLM推理过程自动编译为单一megakernel（超级内核），通过三大...

2025-06-20 talkingdev

近日，一篇关于将大语言模型（LLMs）编译为单一MegaKernel以实现低延迟推理的技术文章引发广泛讨论。该技术通过优化编译器设计，将传统需要多个内核调用的LLM推理过程整合为高度融合的单一内核，显著减少了内核启动...

2025-06-18 talkingdev

在机器人技术领域，实时性至关重要——输入与输出之间的延迟会直接影响机器人的性能表现。尽管视觉-语言-动作（VLA）模型在开放世界泛化方面取得了令人瞩目的成果，但其运行速度往往较慢。近日，一项名为“实时分块”的...

2025-06-17 talkingdev

Groq的低延迟硬件技术现已正式成为Hugging Face Hub及SDK的可选推理服务提供商，这一合作标志着AI基础设施领域的重大突破。通过集成Groq的专用处理器架构，开发者能够以服务器无感知（serverless）方式极速调用Llama...

2025-06-16 talkingdev

Anam最新发布的AI技术标志着人机交互的重大突破，其开发的实时AI角色系统能够以高度拟人化的方式处理客户支持、学习与发展（L&D）以及各类业务咨询。该技术通过轻量级SDK实现快速部署，支持嵌入任何应用程序，显著提...