漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-24 talkingdev

人工智能需求是否在落潮?

人工智能一度被高度炒作,然而近期一些数据显示其需求可能正在萎缩。主要表现在微软的搜索引擎Bing无法从Google手中夺取市场份额,以及使用ChatGPT的人数在减少。人工智能的发展无疑已经改变了许多行业,但这些新的...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-11 talkingdev

提升视觉-语言模型精度的新策略

这个代码库介绍了一种改善视觉-语言模型,特别是在详细属性检测和图像内部位置定位任务中的表现的多任务策略。这种策略以视觉-语言模型CLIP为例,展示了如何通过多任务学习提升模型的表现。通过这种方式,模型可以更...

Read More
2023-08-09 talkingdev

HuggingFace联手AWS和Nvidia云,一键进行模型训练

近日,知名开源人工智能库HuggingFace宣布与AWS和Nvidia展开合作,为平台带来一键式训练功能。用户只需上传数据,即可直接在hub上对先进的模型进行微调。这一创新举措无疑将为AI研究者和开发者提供极大的便利,不再...

Read More
2023-08-07 talkingdev

PerceptionCLIP,开源增强zero-shot击图像分类方法

一项最新研究介绍了PerceptionCLIP,这是一种模拟人类视觉感知过程的两步图像分类方法,旨在更好地利用CLIP,一种突出的视觉语言模型。首先,通过识别背景属性并利用它们区分前景物体,这种新方法在图像分类任务中提...

Read More
2023-07-20 talkingdev

超人AI邮箱:新一代高效邮件处理工具

备受瞩目的电子邮件客户端Superhuman最近推出了一套人工智能功能,旨在帮助繁忙的人们更快地撰写电子邮件。这套新的AI功能能够实现智能写作、智能回复以及智能管理等多种操作,极大地提高了用户处理邮件的效率。Supe...

Read More
2023-06-26 talkingdev

AI生成图像的单一图像编辑方案:解开图像编辑的离散化之道

学习离散化表示是计算机视觉领域的一个令人兴奋的研究领域。像CLIP这样的大规模对比方法一度让离散化研究失去了市场。然而,现在,借助开源扩散模型,我们可以利用文本标记的力量来解开图像中的对象,实现对AI生成图...

Read More
2023-06-23 talkingdev

Stability发布全新Stable Diffusion模型,新版将不再出现意大利面手

稳定性人工智能发布了一种新的人工智能模型,用于生成比以往更逼真的图像。该模型名为SDXL 0.9,可以根据基于文本的提示创建图像,这些图像比以前的模型更美观,并具有更多的构图细节。据悉,Stable Diffusion的下一...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page