当前大型语言模型虽在文本生成领域表现卓越,却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出,构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...
Read More开源游戏引擎Godot近日在GitHub上合并了关键性Pull Request(#105628),宣布实现对Apple visionOS平台的原生支持。这一技术突破意味着开发者可以直接在Godot引擎中为苹果的混合现实头显开发原生应用,无需通过转译...
Read MoreMeta公司近日重磅推出四项人工智能领域的重要技术成果:1)高性能图像编码器,可优化视觉数据的特征提取效率;2)视觉语言模型(VLM),实现跨模态理解与生成;3)基于联合嵌入预测架构(JEPA)的3D物体定位模型,突...
Read MoreInteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...
Read More据最新报道,苹果公司正在研发一款集成了摄像头的AirPods原型。这项集成技术意在为AirPods引入视觉智能,使之能够理解外部环境并向用户提供信息。这种新的AirPods有望与Vision Pro头显配合使用,以增强用户体验并强...
Read More苹果的visionOS软件开发工具包(SDK)现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月,苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...
Read More