漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-21 talkingdev

Gemini图像分割技术揭秘:轻松实现精准视觉识别

Gemini作为谷歌推出的多模态AI模型,其视觉能力一直备受业界关注。最新研究发现,Gemini在图像分割这一计算机视觉核心任务上展现出惊人的易用性。图像分割技术可将数字图像分解为多个具有语义意义的区域,是自动驾驶...

Read More
2025-04-03 talkingdev

[论文推荐]CellVTA通过CNN适配器增强视觉Transformer的细胞实例分割性能

近期发表在arXiv上的研究论文提出了一种名为CellVTA的创新方法,该方法通过引入基于CNN的适配器模块,将高分辨率空间特征注入到基于视觉Transformer的模型中,显著提升了细胞实例分割的精度。这一技术突破在多个基准...

Read More
2024-07-12 talkingdev

OVFormer-引领开放词汇视频实例分割突破

近日,一种名为OVFormer的新方法在开放词汇视频实例分割(VIS)领域引起了广泛关注。该方法解决了该领域的关键问题,改善了嵌入对齐,并利用基于视频的训练来提高时间一致性。OVFormer的核心优势在于它的开放性词汇...

Read More
2024-01-23 talkingdev

论文:BriVIS开放词汇视频实例分割

研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。

Read More
2024-01-20 talkingdev

开源项目:针对新物体的实例分割模型

近日,一款名为Instance Segmentation for Novel Objects的GitHub开源项目备受关注。该项目旨在评估深度学习模型在实例分割方面对新物体的泛化能力。通过该项目,用户可以训练自己的实例分割模型,并对模型进行评估...

Read More
2023-09-25 talkingdev

论文:在线视频实例分割技术TCOVIS

研究人员已经介绍了一种名为TCOVIS的在线视频实例分割技术,这种技术优先考虑时间一致性。在线视频实例分割是计算机视觉领域的热门课题,它的目的是将视频帧中的每个实例独立地识别和分割出来。然而,现有的方法通常...

Read More
2023-08-24 talkingdev

Roboflow-最新开源的视觉模型推理工具

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署,无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

Read More
2023-08-04 talkingdev

论文:无需训练的实例分割,颠覆图像识别技术

此研究引入了一种名为“无需训练的实例分割”的全新方法,该方法无需进行繁琐的训练或详细的图像注释,就能在图像中分割实例。该方法通过使用现有的语义分割模型并通过可学习的对象边界分支对输出进行精炼,无需额外的...

Read More
  1. Next Page