GAN的相关内容 - 漫话开发者

2025-03-24 talkingdev

[开源]Tokenize an Image as a Set：基于集合标记化的图像生成新框架

近日，GitHub上发布了一个名为“Tokenize an Image as a Set”的开源项目，该项目提出了一种全新的图像生成框架。该框架通过集合标记化（set-based tokenization）和新型离散扩散方法（discrete diffusion method），...

2025-02-24 talkingdev

Orakl Oncology近日宣布，将采用Meta的DINOv2模型来加速癌症药物的研发进程。DINOv2作为一种先进的深度学习模型，能够快速分析类器官图像，从而预测患者对治疗的反应。这一技术的应用显著提高了药物研发的效率，为癌...

2024-08-02 talkingdev

近日，研究人员开发出了一种名为Stable Fast 3D的机器学习算法，可以从单一图像中快速生成稳定的高质量3D模型。该算法使用了一种称为Image2StyleGAN的新技术，该技术可以将2D图像转换为3D模型的形状和纹理。通过这种...

2024-06-28 talkingdev

FAL最近公开了超级分辨率图像扩大器AuraSR的源代码。这款工具只需一次前向传递，就可以实现4倍的扩大，甚至在多次应用后仍能保持良好的效果。AuraSR在处理生成的图像上表现出色。FAL公司此次公开源代码，无疑为图像...

2024-06-03 talkingdev

KL散度是一种快速、廉价且强大的方法，用于测量事物之间的一种距离。它在传统和现代人工智能中被广泛使用。这篇文章从视觉和数学角度探讨了这一强大的概念。KL散度，或称Kullback-Leibler散度，是一种用于衡量两个概...

2024-05-16 talkingdev

扰动注意力指引（PAG）是一种提升扩散模型生成图像质量的新方法，无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制，PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

2024-05-14 talkingdev

MRSegmentator是一款新型工具，专为增强MRI扫描分割而设计。它可以有效地识别腹部、盆腔和胸部区域的40种不同器官和结构。这款新工具的开发将极大提高医疗和科研人员的工作效率，提高诊断的准确性。MRSegmentator的...

2024-05-01 talkingdev

StoryDiffusion是一项新的机器学习技术，可用于生成具有长距离相关性的图像和视频。它使用了一种称为StoryGAN的生成模型，可以根据输入的故事情节和场景描述生成相关的图像和视频。这项技术有助于解决传统图像和视频...