漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-12 talkingdev

新技术:Matte Anything激发计算机视觉的新火花

近年来,自主车辆研究的减速使计算机视觉领域的进展似乎放缓了。但现在,一种新技术正在让人们看到希望。该技术使用三个图像模型的水螅来增强自然图像抠图的性能,效果非常引人注目。 ## 核心要点: - Matte Anyth...

Read More
2023-06-08 talkingdev

AI现状:14张图表展示现在的AI技术发展趋势

## 新闻概要: 以下是这篇文章中的三个核心点: - 技术的兴衰周期在当今被压缩得非常紧密。传统技术发展18个月的速度,如今在AI的带动下,瞬息万变。 - 资金和人才正在涌入AI领域,这是一个非常有趣的趋势。 - 现...

Read More
2023-06-08 talkingdev

文本到图像模型中的紧急对应关系

最近,研究人员发现文本图像模型(如Stable Diffusion)可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征,即表示相同的事物,例如人的鼻子,动物的耳朵,汽车的轮胎等。通过巧妙的算法,可以从各种图...

Read More
2023-06-07 talkingdev

研究人员开发了HQ-SAM模型,帮助改善图片分割效果

研究人员开发了HQ-SAM模型,对最近的“Segment Anything Model”(SAM)进行了升级,提高了其轮廓识别复杂结构对象的能力。该模型保留了原有的优点。 ### 核心要点: - 研究人员开发了HQ-SAM模型,对最近的“Segment...

Read More
2023-05-31 talkingdev

用多模态语言模型生成图像

## 新闻内容: - 近来,多种数据类型的多模态训练变得越来越受欢迎。 - 模型架构通常需要复杂且有点脆弱的解决方案。 - Gill是一个很酷的新项目,它将文本标记与图像标记交错使用,从而实现真正的多模态输入和输出...

Read More
2023-05-16 talkingdev

Meta公司推出多模态AI模型ImageBind

Meta公司的ImageBind是一种多模态AI模型,可以根据文本描述生成图片,也可以根据图片生成文本描述。该模型使用互联网上的各种文本和图片进行训练,因此具有很高的准确性和多样性。但是,该模型有时可能会产生不相关...

Read More
2023-05-16 talkingdev

EfficientViT:内存高效的Vision Transformer模型发布

据报道,研究人员近日发表了一篇论文,提出了一种名为EfficientViT的高速Vision Transformer模型。该模型在保证处理速度的同时,能够提高模型的准确度。通过重新设计Transformer模型的某些部分,他们能够显著降低与...

Read More
2023-05-09 talkingdev

轻量级多模态适配器能帮助AI模型更好地理解图像和语言

### 新闻内容: 研究人员创建了一个名为Cola的基准测试,以测试和改进AI模型在组合推理方面的表现。他们发现,当前的AI模型在组合物体和它们的特征方面仍存在困难。而轻量级多模态适配器可以帮助模型更好地理解图像...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page