Gemini作为谷歌推出的多模态AI模型,其视觉能力一直备受业界关注。最新研究发现,Gemini在图像分割这一计算机视觉核心任务上展现出惊人的易用性。图像分割技术可将数字图像分解为多个具有语义意义的区域,是自动驾驶...
Read More近期,视频运动分割技术迎来重要进展,研究人员通过整合Dino和SAM2模型,成功将密集像素追踪应用于长期分割任务。这项技术突破解决了传统方法在复杂场景下跟踪精度不足的问题,通过像素级运动分析显著提升了分割稳定...
Read More近日,一种名为OVFormer的新方法在开放词汇视频实例分割(VIS)领域引起了广泛关注。该方法解决了该领域的关键问题,改善了嵌入对齐,并利用基于视频的训练来提高时间一致性。OVFormer的核心优势在于它的开放性词汇...
Read More研究人员推出了层次语义解码与计数辅助(HDC)框架,以提升广义指代表达分割(GRES)。与以往方法不同,HDC框架通过跨粒度传递互补的模态信息,并聚合语义对应关系,从而实现更好的多层次解码。这一创新方法在复杂场...
Read MoreMeta AI最新推出的Segment Anything Model(简称SAM)是计算机视觉领域的一个重要的基础模型,该模型在图像分割方面表现出色,但在某些特定领域中却显得力不从心。为了解决这个问题,Meta AI推出了一项新的项目,即A...
Read MoreSegRefiner作为一种创新的模型无关解决方案,通过将细化过程视为数据生成过程,显著提升了各种分割任务中的对象掩膜质量。该技术通过离散扩散过程逐像素细化粗糙掩膜,从而提高分割和边界指标的精确度。这一方法的核...
Read MorePSALM是大型多模态模型(LMM)的扩展版本,通过引入一个掩码解码器和多功能输入模式,在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制,而且还使模型能够有效理解和分类复杂图像。PSALM的创...
Read MoreUniVS是一种用于视频分割的统一架构,采用新颖的基于提示的方法应对各种分割任务的挑战。通过将提示特征作为查询并引入目标感知的提示交叉注意力层,UniVS消除了启发式的帧间匹配需求,可以无缝适应不同的视频分割场...
Read More