漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-23 talkingdev

优化3D场景理解:DReg-NeRF的新技术将改变现状

神经辐射场(NeRF)在计算机视觉领域已经成为热门话题,然而如何有效地将多个NeRF结合在一起仍然是一个挑战。为了解决这个问题,研究团队开发出了一种名为DReg-NeRF的新方法。DReg-NeRF能有效提取NeRF中的特征,使用...

Read More
2023-08-22 talkingdev

RLIPv2:一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

Read More
2023-08-18 talkingdev

KernelWarehouse提出一种构建卷积核的更智能方式

KernelWarehouse提出了一种新的动态卷积方法,通过更高效地分解和重组卷积核,为计算机视觉带来了新的可能。这种方法通过在各层之间巧妙地共享和混合预定义的部分,可以使用更少的参数,实现更大的灵活性和强大的功...

Read More
2023-08-17 talkingdev

CIM开源,提升计算机视觉和图像理解能力

在一张图片中,计算机有时会将同一对象识别为多个。现在,一个新的项目开发出一种方法,帮助计算机识别并聚焦于对象的单一完整版本。这种方法的出现,将对计算机视觉和图像理解能力的提升起到关键作用,不仅可以优化...

Read More
2023-08-15 talkingdev

DatasetDM,计算机视觉合成图像生成崛起

该项目引入了一种名为DatasetDM的新工具,它可以生成无尽的虚假图像,并附带详细的标签,比如哪部分是哪个对象或者图像中的物体离得有多远。这对于训练计算机视觉系统非常有用,仅使用一小部分真实照片,合成的图像...

Read More
2023-08-10 talkingdev

提升计算机视觉学生网络的方法开源

深度神经网络在计算机视觉领域有着出色的表现,但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略,能够更好地从老师网络向学生网络传...

Read More
2023-07-26 talkingdev

多样化语言表达物体检测技术开源

该存储库引入了一项名为“描述性物体检测”的新实践任务,它通过允许基于多样化语言描述进行物体检测,而不仅仅是基于预先存在的对象,从而改进了先前的方法。这种新的物体检测方式,更能符合实际应用需求,无论是在复...

Read More
2023-07-24 talkingdev

SlowTV数据集开源,助力单目深度估计能力

近日,研究人员推出了一个名为SlowTV的大规模数据集,该数据集主要从YouTube收集而来,旨在提升自监督单目深度估计模型在不同环境下的深度理解能力。这些环境场景包括徒步旅行的小路、水下场景以及室内空间等。通过...

Read More
  1. Prev Page
  2. 26
  3. 27
  4. 28
  5. Next Page