漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-03 talkingdev

高斯注意力(Gaussian Attention)改进光流的研究进展(GitHub Repo)

光流技术是帮助我们理解图像中物体运动的重要技术。一项新的研究利用高斯注意力(Gaussian Attention),专注于更细微的细节并更好地将它们匹配起来,从而研发出了一个名为GAFlow的模型。高斯注意力的使用,可以使光流...

Read More
2023-09-28 talkingdev

UnitedHuman:高质量人像图像生成方式开源

本项目推出了一款名为UnitedHuman的新工具,它能够使用来自多个不同来源的图像,并将它们进行组合,即使这些图像的大小不同或者关注的焦点不同。UnitedHuman的强大之处在于,它能够克服这些差异,生成出高质量的人像...

Read More
2023-09-28 talkingdev

全新的图像增强工具HMTF-Net开源

近日,一个名为HMTF-Net的全新图像增强工具在GitHub上公开。该工具的主要功能是提升照片的质量,其使用的方式相比其他方法更为易懂。HMTF-Net根据照片的不同部分,智能分析并确定最佳的增强方式进行处理。由于其操作...

Read More
2023-09-21 talkingdev

DFormer开源,更深入理解RGB-D图像

DFormer是一种独特的方法,可以同时研究图像的颜色和深度。与旧有的方法不同,DFormer专为RGB-D图像设计。RGB-D图像是一种同时包含颜色信息(R,G,B)和深度信息(D)的图像。DFormer的设计目标是提供一种更有效的...

Read More
2023-09-20 talkingdev

HF transformers,最新的背景移除技术

Matting是一种创建黑白掩膜以分割出图像重要部分的过程。它通常用于前景和背景的分割。智能手机的人像模式使用了一种与这里描述的ViTMatte相似的方法。这种技术发展现代化,为未来的图像处理技术开创了新的可能。此...

Read More
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-09-11 talkingdev

利用Segment Anything模型对医疗图像分割的改进

Segment Anything模型(SAM)对于常规图像的处理效果显著,但对于医疗图像的处理效果却不尽如人意。为此,研究者们创建了SAM-Med2D,这是通过在大量医疗图像上训练SAM并提供各种输入信息得到的。这种新模型在处理医...

Read More
2023-09-01 talkingdev

论文:用文本调制技术提升图像生成质量

仅从少数样本中产生多样化的图像一直是技术上的挑战。而新的技术——TexMod,采用独特的技术方法,将各种图像的细节融合在一起,并确保生成的图像具有逻辑性的布局。TexMod的出现,不仅提升了图像生成的质量,也为图像...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page