3D的相关内容 - 漫话开发者

2025-03-28 talkingdev

揭秘大型语言模型的思维轨迹

随着人工智能技术的飞速发展，大型语言模型（LLM）的复杂性和能力不断提升，但其内部决策过程仍被视为“黑箱”。近日，研究人员通过先进的追踪技术，成功揭示了LLM在生成文本时的思维路径。这一突破不仅有助于提升模型...

2025-03-26 talkingdev

视觉几何基础Transformer（Visual Geometry Grounded Transformer，简称VGGT）是一种前馈神经网络，能够直接从场景的一个、几个甚至数百个视角中推断出所有关键的3D属性，包括外部和内部相机参数、点云图、深度图以...

2025-03-26 talkingdev

FFaceNeRF是一种基于NeRF（神经辐射场）的3D人脸编辑技术，通过克服传统NeRF方法中固定蒙版的限制，显著提升了3D人脸编辑的灵活性和精度。NeRF作为近年来计算机视觉领域的热门技术，能够在3D场景重建中生成高质量的...

2025-03-25 talkingdev

Roblox近日开源了其最新的AI模型Cube 3D，该模型能够通过文本提示生成3D对象，旨在提升创作效率。Cube 3D采用了先进的标记化技术，并通过授权和公开可用的数据集，以及Roblox自身的体验数据进行训练。未来，Cube 3D...

2025-03-24 talkingdev

近日，GitHub上发布了一个名为LHM（Large Animatable Human Reconstruction Model）的开源项目，该项目展示了如何通过单张图像快速生成一个完全可动画的3D人体模型。这一技术突破不仅展示了计算机视觉领域的重大进展...

2025-03-24 talkingdev

SynCity是一种革命性的系统，能够直接从文本提示生成详细的3D世界，而无需任何训练。该系统结合了2D图像生成器和3D生成器的优势，前者确保了艺术质量，后者则提供了精确的几何结构。SynCity以分块的方式构建场景，并...

2025-03-20 talkingdev

近日，Stability推出了一项名为Stable Virtual Camera的创新技术，该技术基于一种多视角扩散模型，能够从单张或多张2D图像中生成沉浸式3D视频。这一技术允许用户自定义或预设相机轨迹，从而实现对3D场景的灵活控制。...

2025-03-19 talkingdev

Stability AI近日发布了一款强大的多视角虚拟相机系统，该系统能够实现新颖视图合成（Novel View Synthesis），为用户提供了一种高效且非商业化的解决方案。虽然该技术尚未达到行业最先进水平，但其优势在于仅需两次...