具身智能的相关内容 - 漫话开发者

2026-07-31 talkingdev

谷歌DeepMind推出Gemini Robotics ER 2，重新定义机器人视频理解与多机协作

谷歌DeepMind正式发布了新一代机器人AI系统Gemini Robotics ER 2，该系统在视频理解、工具编排和多机器人协作方面实现了阶跃式突破。ER 2将先进的Gemini大语言模型与机器人深层控制相结合，使机器人不仅能够更精准地...

2026-07-28 talkingdev

英伟达NeMo团队近日在GitHub上开源了一个名为Molt的智能体强化学习框架。该框架采用PyTorch原生设计，核心理念是将智能体本身视为可执行的程序，而非传统强化学习中固定的策略网络。Molt支持高度灵活的自定义Python...

2026-07-21 talkingdev

英伟达在Hugging Face上正式推出Cosmos 3 Edge，这是一款拥有40亿参数的开源世界模型，专为边缘设备上的机器人与视觉AI体设计。该模型通过共享的世界表征，将环境理解、实时预测、模拟与动作生成统一在同一框架下，...

2026-07-18 talkingdev

据彭博社报道，日本正计划从英伟达采购27,500颗下一代Rubin芯片，用以构建一个面向机器人领域的国产基础人工智能模型。该项目由Noetra牵头，联合软银、索尼及NEC等科技巨头共同推进，被视为日本在“主权AI”战略上的重...

2026-07-16 talkingdev

人工智能公司Thinking Machines正式发布了其首个开放权重模型Inkling。这是一个参数规模高达9750亿的混合专家（Mixture-of-Experts）Transformer模型，原生支持文本、图像和音频的多模态输入与理解。Inkling最引人注...

2026-07-14 talkingdev

DeepMind提出了GenCeption，将预训练的视频生成模型重新设计为一种可通过文本指令控制的统一视觉系统，引发学界关注。该模型基于前馈、非自回归的生成式架构，不需要针对下游任务进行微调即可同时处理深度估计、表面...

2026-07-14 talkingdev

Sakana AI 将其在集体智能领域的探索从软件推向了物理世界，发布了“智能细胞砖”（Smart Cellular Bricks）项目。这种模块化硬件砖块摒弃了传统集中式控制架构，每一块砖都内嵌局部通信模块和小型神经网络，能够通过...

2026-06-02 talkingdev

英伟达今日正式发布Cosmos 3，这是一款面向物理AI的开源世界基础模型，标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器（Mixture-of-Transformers）架构，将视觉推理、世界生成...