在SIGGRAPH 2025大会上,UploadVR记者David Heaney体验了Meta最新研发的PC VR头显原型Boba 3。该设备采用与Quest 3相似的外形设计,但实现了180°×120°的超宽视场角,显著提升了沉浸感。作为Meta在VR领域的技术探索,...
Read More在SIGGRAPH 2025大会上,UploadVR记者David Heaney亲身体验了Meta公司代号为Tiramisu的VR研究原型机。该设备以‘超现实’为核心卖点,整合了三大前沿技术:超越视网膜级别的分辨率(单眼8K以上)、峰值亮度达10,000尼...
Read More艾伦人工智能研究所(AI2)近日开源了MolmoAct模型,这是首个基于Molmo框架构建的、专注于三维空间推理的动作理解系统。该模型通过创新的三维空间表征学习方法,实现了对复杂指令的精准环境交互能力,在SpatialQA等...
Read More在快节奏的现代生活中,成年人的社交困境已成为一个普遍现象。尤其是在30岁左右(甚至20多岁后期),人们发现结交新朋友变得异常困难。毕业后,生活迅速变得忙碌,尽管人们口头上承诺保持联系,但现实往往事与愿违。...
Read MoreFrame Pack是一种创新的视频生成方法,它通过利用图像潜在空间和巧妙的帧打包技术,显著降低了长视频生成的计算负担。该方法不仅实现了令人信服的生成效果,而且安装过程简便易行。Frame Pack的核心在于将视频帧视为...
Read MoreMidjourney公司正式推出其首款AI视频生成模型V1,该模型能够将任意静态图像转化为5秒的动态视频,标志着AI在多媒体内容生成领域的又一重大突破。尽管目前仅支持通过Discord平台使用,但其技术潜力不容小觑。据公司透...
Read More微软研究院推出的RenderFormer是一项突破性的神经渲染技术,能够直接从三角形基础场景表征生成具有完整全局光照效果的逼真图像。该技术的核心优势在于其通用性——不同于传统神经渲染方法需要针对每个场景进行单独训练...
Read MoreInteractVLM作为新一代视觉语言模型(VLM),实现了从2D到3D的交互推理跨越。该模型通过创新性地利用强大的基础模型,结合多视角渲染技术,将2D推理能力提升至3D空间,能够精准分析人类与物体在三维环境中的接触关系。...
Read More