漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-13 talkingdev

Bria 3.2新一代AI图像模型开放早期体验:100%合规数据训练,突破文本渲染技术

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

Read More
2025-05-26 talkingdev

谷歌Veo AI视频技术亮相Flow TV平台,展示用户生成内容新形态

谷歌旗下实验室推出的Flow TV平台,通过持续流媒体形式展示由用户生成的AI视频片段及其对应提示词,并按主题频道进行分类。该平台基于谷歌最新Veo AI视频生成技术,标志着生成式AI在影视内容创作领域的重大突破。Veo...

Read More
2025-05-16 talkingdev

Meta FAIR团队发布支持分子属性预测、扩散建模和语言学习神经科学的新数据集与模型

Meta旗下FAIR(基础人工智能研究)团队近日宣布推出多项重要开源成果,涵盖三大前沿领域:1) 分子属性预测数据集与模型,将加速药物发现与材料科学研发流程;2) 扩散模型(Diffusion Models)相关资源,为当前最热门...

Read More
2025-05-09 talkingdev

Freepik推出基于授权数据的开源AI图像生成器F Lite

Freepik近日发布了名为F Lite的AI图像生成模型,该模型是与Fal.ai合作开发,并利用64块Nvidia H100 GPU进行训练。F Lite的独特之处在于其训练数据全部来自经过授权的、适合工作场景的图像,确保了生成内容的合法性和...

Read More
2025-04-21 talkingdev

[论文推荐]MaskMark:基于掩码的全局与局部双模式图像水印框架

近期arXiv平台发布的研究论文《MaskMark》提出了一种创新的图像水印技术方案,其核心是通过掩码驱动的Encoder-Distortion-Decoder(编码-失真-解码)框架,实现全局与局部水印的双模式灵活嵌入。该技术突破传统水印...

Read More
2025-03-28 talkingdev

Bria AI在NVIDIA GTC 2025大放异彩:构建可预测、可控的视觉生成AI内容

上周,超过2万名与会者齐聚圣何塞市中心参加2025年NVIDIA GTC大会。AI开发者们从Bria.ai了解到如何大规模构建可预测、可控且符合品牌形象的视觉内容,同时尊重艺术家的权利。Bria.ai在大会上展示了几个关键主题:基...

Read More
2025-03-14 talkingdev

[开源] Open Sora项目发布代码与模型权重,低成本训练成果引人瞩目

Open Sora项目自模型首次发布以来,一直在积极推进,并以低于20万美元的成本训练出了一个具有竞争力的模型。此次,项目团队全面公开了所有代码和模型权重,旨在帮助研究人员和开发者复现其实验结果。尽管模型的动态...

Read More
2025-03-14 talkingdev

Genies推出AIGC驱动系统,革新游戏资产创作流程

Game Art Forge近期推出的AI生成模板系统,旨在优化游戏资产创作的流程,提升开发者的速度、扩展性和创作控制力。该系统不仅支持高度定制化,还能保持设计一致性,为独立开发者及大型团队提供强有力的支持。通过结合...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page