该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...
Read More该存储库引入了一项名为“描述性物体检测”的新实践任务,它通过允许基于多样化语言描述进行物体检测,而不仅仅是基于预先存在的对象,从而改进了先前的方法。这种新的物体检测方式,更能符合实际应用需求,无论是在复...
Read MoreInstructCTG是一种受自然语言描述和演示控制的文本生成框架。这种灵活的方法通过少量训练即可在上下文学习和少量任务泛化中实现模型的自适应,并保持生成的质量和速度。以下是该框架的三个核心点: - InstructCTG使...
Read More