CogCoM开源新视觉语言模型,增强视觉推理能力
talkingdev • 2024-02-12
995969 views
CogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。
talkingdev • 2024-02-12
995969 views
CogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。