漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-24 talkingdev

[论文推荐] 更快速、更轻量的视觉Transformer:低至高多级Transformer实现图像超分辨率

近日,一项名为低至高多级Transformer(Low-to-high Multi-Level Transformer)的新技术针对当前视觉Transformer(ViT)在图像超分辨率任务中存在的复杂性和效率低下问题提出了创新解决方案。该技术通过优化Transfor...

Read More
2025-04-15 talkingdev

[开源]GigaTok:3B参数规模的图像分词器突破,重建性能卓越

近期,SilentView团队在GitHub开源了名为GigaTok的超大规模图像分词器项目,其参数量高达30亿(3B),在图像重建任务中展现出卓越性能。传统图像分词器在规模化过程中常面临性能崩溃问题,而GigaTok通过创新的解码器...

Read More
2025-03-25 talkingdev

[开源] Awesome MRI Reconstruction:深度学习在MRI重建中的前沿应用

随着深度学习技术的迅猛发展,其在医学影像处理领域的应用也日益广泛。最近,一个名为“Awesome MRI Reconstruction”的开源项目在GitHub上引起了广泛关注。该项目精心收集了大量关于深度学习在磁共振成像(MRI)重建...

Read More
2025-03-19 talkingdev

Niagara推出单视图3D场景重建新框架

近日,一项名为Niagara的创新框架在3D场景重建领域取得了重要进展。该框架通过从单张图像中重建户外3D场景,结合深度和法线估计,以及几何仿射场和3D高斯解码技术,显著提升了重建的精确度和效率。这一技术不仅解决...

Read More
2025-03-12 talkingdev

Perception Efficient Reconstruction:结合文本查询与3D图像重建的创新方法

近日,GitHub上发布了一项名为Perception Efficient Reconstruction的创新技术,该方法将文本查询能力与从图像中进行3D重建的技术相结合。该系统采用前馈模型(feed forward model),能够实现快速的三维重建。这一...

Read More
2024-03-14 talkingdev

TripoSR:使用单张图像实现3D重建

TripoSR是一种使用前向模型从2D图像重建3D模型的方法。它运行非常快,且接近于当前任务的最新技术水平。

Read More
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-10-04 talkingdev

视觉-语言模型DA-CLIP带来更优秀的图像修复效果

视觉-语言模型如CLIP在许多任务中表现出色,但在图像修复方面却面临一些挑战。因此,一项新的项目引入了DA-CLIP模型,该模型优化了CLIP的工作方式,使其更好地处理这些任务,从而带来更清晰的图像重建。DA-CLIP模型...

Read More
  1. Next Page