3D的相关内容 - 漫话开发者

2023-11-29 talkingdev

Stable Video Diffusion发布，AI模型全面升级

Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。

2023-11-14 talkingdev

这项研究提出了3DStyle-Diffusion模型，这是一种用于对3D网格进行细节风格化的新方法，整合了2D扩散模型以增加对外观和几何形状的控制。它通过首先使用隐式MLP网络将3D网格的纹理参数化为反射和照明，然后使用预训练...

2023-11-09 talkingdev

OVIR-3D是一项创新技术，可以通过2D图像融合实现从文本提示中检索3D对象，无需3D数据训练，从而实现即时实时搜索功能，非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库，使更多开发者可以在其应用中...

2023-11-08 talkingdev

新技术DADA系统集成3D数据和RGB图像，实现了卓越的表面异常检测，速度和准确度均优于传统方法，无需大量训练数据集。

2023-11-02 talkingdev

对于与人工智能合作的创意工作者来说，.obj格式的3D资产生成是下一个重大创新。Stability AI正在努力实现这一目标。本文缺乏详细信息，但令人兴奋的是，未来几乎已到。

2023-10-25 talkingdev

SAM-Med3D是Segment Anything Model（SAM）的升级版，专门针对3D医学影像进行了优化。虽然原始的SAM在处理3D医学影像时存在困难，但是经过对超过131K个3D掩模的广泛数据集进行训练的SAM-Med3D在捕捉3D空间细节方面使...

2023-10-19 talkingdev

MonoSKD是一种革命性的方法，它使用一张图像就可以检测3D物体，有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征，而MonoSKD仅需要一张图像就能完...

2023-10-17 talkingdev

这项研究介绍了一种名为Ex-MCR的新方法，该方法可以有效地学习多个模态的统一对比表示，而无需配对数据。通过对齐现有的多模态对比表示，Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...