漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-24 talkingdev

Roboflow-最新开源的视觉模型推理工具

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署,无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

Read More
2023-08-22 talkingdev

RLIPv2:一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

Read More
2023-08-17 talkingdev

强化学习:微型故事模型的对齐工具

强化学习可能是当前对齐大型语言模型(甚至视觉模型)最好的工具。然而,当你需要大量的人类数据来训练一个奖励模型时,这就成为了一项挑战。如果你可以只使用“提示”呢?这是RLCF(强化学习计算框架)趋势的又一绝佳...

Read More
2023-07-05 talkingdev

基于代码的计算机视觉研究平台(GitHub代码库)

Scenic是一个以注意力为核心的计算机视觉研究代码库。

Read More
2023-06-26 talkingdev

TIMM计算机视觉工具套件

TIMM中有许多顶级计算机视觉模型,但在处理生产系统时,通常需要更多。OpenMMlab提供了一套高质量的系统,用于各种视觉任务,如姿态和分割。

Read More
2023-06-15 talkingdev

SoViT:一种更高效的视觉转换器

**研究团队最新发布的技术论文介绍了SoViT,这是一种针对大小和形状进行了优化的视觉转换器,使用先进的缩放方法,其性能与更大的模型相当,但计算量更少。SoViT在图像分类、字幕生成、视觉问答和零样本转移等各个任...

Read More
2023-06-12 talkingdev

新加坡推出多模态文本/视觉模型

新闻概要: - 新加坡研究人员收集了一个新的视觉指导调整数据集。 - 他们训练了一个多模态文本/视觉模型,并在过程中进行了一些算法调整。 - 该模型的演示令人印象深刻,特别是在苹果发布增强现实技术后,展示了人...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6