漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-21 talkingdev

Gemini Advanced用户现可通过Veo 2模型生成高清电影级视频

谷歌最新宣布,Gemini Advanced用户即日起可利用Veo 2模型实现文本到视频的AI生成能力。这项突破性技术可将自然语言描述直接转化为1080P分辨率、具有电影质感的动态影像,标志着多模态AI在视频创作领域的重大进展。V...

Read More
2025-04-21 talkingdev

[论文推荐]MaskMark:基于掩码的全局与局部双模式图像水印框架

近期arXiv平台发布的研究论文《MaskMark》提出了一种创新的图像水印技术方案,其核心是通过掩码驱动的Encoder-Distortion-Decoder(编码-失真-解码)框架,实现全局与局部水印的双模式灵活嵌入。该技术突破传统水印...

Read More
2025-04-07 talkingdev

AI生成吉卜力风格图像爆红:关于创造力本质的重新思考

近期AI生成的吉卜力风格视觉作品引发热潮,导致OpenAI服务器负载激增,同时引发了关于AI时代创造力本质的深刻讨论。虽然人工智能能够快速生成具有艺术性的图像,但它缺乏人类体验和综合复杂思想与情感的能力。专家指...

Read More
2025-04-01 talkingdev

[论文推荐]Video Generation Faithfulness Benchmark:评估视频生成模型对提示词的忠实度

近日,arXiv平台发布了一项名为'Video Generation Faithfulness Benchmark'的研究,旨在系统评估视频生成模型对用户输入提示词(prompt)的忠实度。该研究不仅建立了首个针对视频生成忠实度的量化评估体系,还创新性...

Read More
2025-03-28 talkingdev

Bria AI在NVIDIA GTC 2025大放异彩:构建可预测、可控的视觉生成AI内容

上周,超过2万名与会者齐聚圣何塞市中心参加2025年NVIDIA GTC大会。AI开发者们从Bria.ai了解到如何大规模构建可预测、可控且符合品牌形象的视觉内容,同时尊重艺术家的权利。Bria.ai在大会上展示了几个关键主题:基...

Read More
2025-03-14 talkingdev

[开源] Open Sora项目发布代码与模型权重,低成本训练成果引人瞩目

Open Sora项目自模型首次发布以来,一直在积极推进,并以低于20万美元的成本训练出了一个具有竞争力的模型。此次,项目团队全面公开了所有代码和模型权重,旨在帮助研究人员和开发者复现其实验结果。尽管模型的动态...

Read More
2025-03-14 talkingdev

Genies推出AIGC驱动系统,革新游戏资产创作流程

Game Art Forge近期推出的AI生成模板系统,旨在优化游戏资产创作的流程,提升开发者的速度、扩展性和创作控制力。该系统不仅支持高度定制化,还能保持设计一致性,为独立开发者及大型团队提供强有力的支持。通过结合...

Read More
2025-03-13 talkingdev

Genies推出AIGC驱动系统,革新游戏资产创建流程

Game Art Forge通过引入AI生成模板,正在彻底改变游戏资产的创建方式。该系统不仅大幅提升了开发速度,还增强了可扩展性和创意控制,使开发者能够实现高度自定义的同时保持一致性。无论是独立开发者还是大型团队,都...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page