[开源]SAMWISE视频分割技术:为SAM模型赋予开放词汇分割与长视频语义追踪能力
talkingdev • 2025-04-01
6940 views
GitHub开源项目SAMWISE实现了计算机视觉领域的重大突破,通过扩展Segment Anything Model(SAM)的核心能力,使其具备开放词汇分割(open-vocabulary segmentation)和长视频精确语义追踪功能。该技术突破性地解决了传统视频分割模型在动态场景中语义连续性差、标注依赖性强等痛点:1)通过多模态对齐架构,支持用户自定义文本提示词实现任意物体分割;2)采用时序一致性算法,在长达数小时的视频中保持物体ID和语义特征的稳定性,误差率较传统方法降低47%。这一进展将直接推动自动驾驶场景理解、影视后期制作、医疗影像分析等领域的智能化升级,目前已在GitHub获得超过2.4k星标,被NVIDIA等企业列入技术观察清单。