计算机视觉的相关内容 - 漫话开发者

2023-09-01 talkingdev

评估计算机视觉模型的公平性：Meta发布DINO v2模型

在持续推动成为AI领域的开源贡献者的过程中，Meta公司近日公布了他们的DINO v2模型，并采用了更为宽松的许可证，允许社区在其基础上进行构建。此外，他们还发布了一个数据集，有助于确定并对各种计算机视觉模型中的...

2023-08-25 talkingdev

大多数计算机视觉工具在使用LiDAR点追踪3D物体时，由于干扰或未注意到长期运动，常常遇到困难。为了解决这些问题，MTM-Tracker混合使用了两种方法，并分为两个阶段进行工作。在第一阶段，MTM-Tracker使用基于模型的...

2023-08-24 talkingdev

近日，一群研究者开发出一套名为TOPIC的新系统，能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动，而且还可以有效处理对象的外观变化，显著提高了多目标跟踪的准确性和效率。为...

2023-08-24 talkingdev

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署，无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

2023-08-23 talkingdev

神经辐射场（NeRF）在计算机视觉领域已经成为热门话题，然而如何有效地将多个NeRF结合在一起仍然是一个挑战。为了解决这个问题，研究团队开发出了一种名为DReg-NeRF的新方法。DReg-NeRF能有效提取NeRF中的特征，使用...

2023-08-22 talkingdev

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法，但是它存在一些问题，尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2，这是一个更快速的版本，它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

2023-08-18 talkingdev

KernelWarehouse提出了一种新的动态卷积方法，通过更高效地分解和重组卷积核，为计算机视觉带来了新的可能。这种方法通过在各层之间巧妙地共享和混合预定义的部分，可以使用更少的参数，实现更大的灵活性和强大的功...

2023-08-17 talkingdev

在一张图片中，计算机有时会将同一对象识别为多个。现在，一个新的项目开发出一种方法，帮助计算机识别并聚焦于对象的单一完整版本。这种方法的出现，将对计算机视觉和图像理解能力的提升起到关键作用，不仅可以优化...