漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-01-28 talkingdev

1Prompt1Story:无需训练的文本到图像生成新方法

1Prompt1Story是一种无需训练的文本到图像生成方法,通过单一串联提示实现一致的图像生成。该方法的核心在于将多个提示信息串联成一个整体,从而在生成过程中保持一致性。与传统的训练依赖型方法不同,1Prompt1Story...

Read More
2025-01-28 talkingdev

DeepSeek发布Janus Pro:全新文本生成图像工具

近日,DeepSeek正式发布了其最新的文本生成图像工具Janus Pro。该工具基于先进的LLM技术,结合embedding和LoRA优化,能够将用户输入的文本描述快速转化为高质量的图像。Janus Pro不仅支持多种艺术风格,还通过RAG技...

Read More
2024-12-25 talkingdev

Qwen 发布新一代视觉推理模型 QvQ,引领视觉AI新纪元

近期,Qwen公司宣布推出了其最新研发的视觉推理模型QvQ,这款模型在视觉理解和推理方面取得了重大突破。QvQ利用深度学习技术,通过分析图像内容,对图像中的对象、场景和动作进行精准识别与推理。QvQ模型的推理能力...

Read More
2024-12-11 talkingdev

在消费级硬件上实现近即时AI图像生成模型

随着人工智能技术的快速发展,一个全新的AI模型被开发出来,旨在实现在普通消费级硬件上快速生成图像。这项技术利用深度学习算法和神经网络,使得图像创建过程几乎无需等待时间,大大提升了图像生成的效率。以往的图...

Read More
2024-10-31 talkingdev

AI OmniGen:一款视觉一致性的AI图像生成

AI OmniGen是一款新推出的AI图像生成器,旨在提供一致的视觉效果。该工具利用先进的深度学习技术生成高质量的图像,广泛应用于广告、设计和内容创作等领域。与其他图像生成器相比,AI OmniGen在生成过程中的视觉连贯...

Read More
2024-10-17 talkingdev

线性扩散变换器助力高效高分辨率图像合成

近日,研究人员提出了一种高效的线性扩散变换器(linear diffusion transformer),该技术显著提升了高分辨率图像合成的效率。传统的图像合成方法通常面临生成速度慢和计算资源消耗大的问题,而线性扩散变换器通过优...

Read More
2024-10-04 talkingdev

FLUX1.1 [pro]:Black Forest Labs推出全新SotA文本到图像模型

FLUX1.1 [pro]是由Black Forest Labs最新推出的文本到图像模型,代表了当前技术的前沿水平(SotA)。该模型通过先进的算法和深度学习技术,实现了更高质量和更快速度的图像生成能力。FLUX1.1 [pro]不仅在生成图像的...

Read More
2024-07-25 talkingdev

MINT-1T-拥有万亿令牌的多模态数据集

研究人员宣布了一个新的数据集,其中包含了一个拥有1万亿令牌的多模态数据集。该数据集包括图像、音频和文本数据,并可用于训练人工智能算法。通过使用这个数据集,研究人员可以更好地理解人类语言和视觉系统的工作...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page