漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-12 talkingdev

空间智能:AI从语言大师迈向世界构建者的下一前沿

当前大型语言模型虽在文本生成领域表现卓越,却存在根本性认知缺陷——缺乏人类与生俱来的空间智能。最新研究指出,构建具备几何一致性与物理规律模拟能力的“世界模型”将成为突破这一瓶颈的关键。这类模型能通过处理图...

Read More
2025-04-23 talkingdev

[开源] Godot引擎正式支持visionOS原生平台

开源游戏引擎Godot近日在GitHub上合并了关键性Pull Request(#105628),宣布实现对Apple visionOS平台的原生支持。这一技术突破意味着开发者可以直接在Godot引擎中为苹果的混合现实头显开发原生应用,无需通过转译...

Read More
2025-04-18 talkingdev

Meta发布多项AI新成果:图像编码器、视觉语言模型及3D物体定位系统

Meta公司近日重磅推出四项人工智能领域的重要技术成果:1)高性能图像编码器,可优化视觉数据的特征提取效率;2)视觉语言模型(VLM),实现跨模态理解与生成;3)基于联合嵌入预测架构(JEPA)的3D物体定位模型,突...

Read More
2025-04-15 talkingdev

[论文推荐]InteractVLM:基于2D基础模型的3D交互推理新突破

InteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...

Read More
2025-02-10 talkingdev

苹果正在研发内置摄像头的AirPods,或将引领智能穿戴新趋势

据最新报道,苹果公司正在研发一款集成了摄像头的AirPods原型。这项集成技术意在为AirPods引入视觉智能,使之能够理解外部环境并向用户提供信息。这种新的AirPods有望与Vision Pro头显配合使用,以增强用户体验并强...

Read More
2023-06-22 talkingdev

Apple发布新版visionOS SDK,开发者工具现已可用

苹果的visionOS软件开发工具包(SDK)现已通过Xcode 15 beta 2提供。该SDK使开发者能够创建将数字内容与现实世界融合的空间计算应用程序。下个月,苹果将在库比蒂诺、伦敦、慕尼黑、上海、新加坡和东京开设开发者实...

Read More