漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-29 talkingdev

LightGlue:更智能快速的图像匹配技术(GitHub开源)

LightGlue是一种新技术,可以更轻松、更快速地找到图片之间的相似之处,甚至比当前最好的方法Superglue还要好。LightGlue最好的部分是它可以根据图像复杂度进行自适应,对于简单的图像可以更快地工作,在实时应用中...

Read More
2023-05-23 talkingdev

Meta的语音识别技术可识别1100多种语言

Meta科学家在一个名为Massively Multilingual Speech(MMS)的项目中取得了突破性进展,教会了机器如何理解和说出成千上万种语言。该技术使用自学习系统和超过1,100种语言的数据库,旨在使信息更易于获取,并帮助保...

Read More
2023-04-18 talkingdev

Multimodal C4:一个开放的、具有十亿级图像的文本语料库

以下是本新闻的三个核心要点: - Multimodal C4(mmc4)是一个公开可用的数据集,它将纯文本的c4语料库与交错的图像相结合,支持像Flamingo这样的上下文视觉和语言模型。该数据集使用带有CLIP特征的线性分配算法创...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16