具身智能的相关内容 - 漫话开发者

2026-06-02 talkingdev

视频智能体模型是下一波浪潮 — xAI Grok Imagine 负责人 Ethan He 深度解读

在生成式AI的激烈竞争中，视频生成与世界模型正成为下一个前沿战场。Ethan He，这位曾领导NVIDIA Cosmos世界模型项目的核心人物，在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

2026-04-07 talkingdev

近日，一个名为Hippo Memory的开源项目在GitHub上发布，旨在为AI智能体构建一个受生物学启发的记忆系统，以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体，通过模拟记忆衰减...

2026-02-13 talkingdev

Meta与Hugging Face联合发布了开源框架OpenEnv，该框架旨在通过标准化的gym风格API和MCP工具接口，统一AI智能体与真实、有状态环境（如操作系统、应用程序）的交互方式。这一举措标志着AI智能体评估从封闭的模拟环境...

2026-02-04 talkingdev

近日，Hugging Face发布深度博文，系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出，以DeepSeek为代表的开源模型发布事件，标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...

2025-12-22 talkingdev

人工智能领域知名专家安德烈·卡帕西（Andrej Karpathy）近期发布了其对2025年大语言模型（LLM）发展的年度回顾，系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出，技术演进的核心驱动力已从单纯追求模...

2025-11-14 talkingdev

在人工智能领域，世界模型（World Models）正成为新一代AI系统的核心研究方向。斯坦福大学教授李飞飞与图灵奖得主Yann LeCun近期分别提出了基于不同技术路径的世界模型架构。李飞飞团队聚焦于结合高斯溅射（Gaussian...

2025-11-12 talkingdev

当前大型语言模型虽在文本生成领域表现卓越，却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出，构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...

2025-11-05 talkingdev

当前最强大的开源大语言模型普遍采用自回归解码器架构的Transformer模型，但近年来涌现出多种创新架构。这些模型不仅关注计算效率的提升，更致力于突破性能瓶颈。文本扩散模型通过模拟去噪过程生成连贯文本，在创造...