漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-13 talkingdev

Bria 3.2新一代AI图像模型开放早期体验:100%合规数据训练,突破文本渲染技术

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

Read More
2025-05-29 talkingdev

PixelFlow开源-直接在像素空间生成高质量图像

PixelFlow是近期在GitHub上开源的一个创新图像生成模型,其最大特点是直接在像素空间生成图像,无需依赖变分自编码器(VAE)。这一技术突破带来了显著的图像质量提升和更精细的语义控制能力,同时在生成效率和基准测...

Read More
2025-05-20 talkingdev

谷歌发布Veo 3、Imagen 4及影视制作新工具Flow,生成式媒体模型再升级

在2025年谷歌I/O大会上,谷歌正式推出新一代生成式媒体模型Veo 3和Imagen 4,以及专为影视制作设计的新工具Flow。Veo 3作为视频生成模型的迭代版本,在动态细节和场景连贯性上实现突破;Imagen 4则进一步提升了文本...

Read More
2025-05-09 talkingdev

Freepik推出基于授权数据的开源AI图像生成器F Lite

Freepik近日发布了名为F Lite的AI图像生成模型,该模型是与Fal.ai合作开发,并利用64块Nvidia H100 GPU进行训练。F Lite的独特之处在于其训练数据全部来自经过授权的、适合工作场景的图像,确保了生成内容的合法性和...

Read More
2025-04-30 talkingdev

CogView 4图像生成模型发布:性能超越Flux模型,开放许可引关注

清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...

Read More
2025-03-04 talkingdev

ImageNet在文本到图像生成中的潜力探索

大多数文本到图像生成模型依赖于从网络上抓取的大量自定义数据。然而,一项最新研究探讨了仅使用ImageNet数据集训练图像生成模型的可能性。研究发现,通过合成生成的密集标注(dense captions)能够显著提升模型性能...

Read More
2025-02-21 talkingdev

Flex 1图像生成模型在Hugging Face Hub发布,性能与速度兼具

近日,社区推出了一款名为Flex 1的图像生成模型,该模型基于Flux Schnell进行微调,并采用Apache许可证。Flex 1的设计参数为8B,能够在保持高性能的同时实现快速运行。这一模型的推出为图像生成领域提供了新的工具,...

Read More
2025-01-28 talkingdev

CoT推理助力自回归图像生成技术突破

近日,一项关于CoT(Chain-of-Thought)推理在自回归图像生成领域的研究项目引发了广泛关注。该项目通过探索CoT推理的潜力,旨在提升自回归图像生成模型的表现。自回归模型在图像生成任务中通常依赖于逐步预测像素值...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page