VLM的相关内容 - 漫话开发者

2023-11-15 talkingdev

论文：保护视觉语言模型的水印方法

在深度学习领域中，视觉语言模型（VLM）越来越受到重视。由于Embedding as a Service Vision-Language Pre-Trained Models（VLPM）中的预训练模型包含了大量的视觉和语言信息，因此这种模型很容易成为恶意攻击的目标...

CogVLM-17B是一个开放式的视觉语言模型，具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色，并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型，将为计算机视觉和自然语言处理领域的发...

Cola是一个使用大型语言模型来协调各种视觉语言模型（VLM）以改进视觉推理的系统。该代码库已经在GitHub上发布。