漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-11 talkingdev

Grok V7升级版完成预训练,原生多模态支持音视频处理

马斯克旗下xAI团队开发的Grok模型即将迎来重大更新,内部版本号V7已完成预训练。此次升级的核心突破在于原生多模态能力的实现,模型可直接处理音频和视频输入,标志着通用人工智能在跨模态理解领域迈出关键一步。值...

Read More
2025-08-05 talkingdev

开源|Qwen-Image:突破性图像基础模型实现原生文本渲染

Qwen-Image作为一款200亿参数的MMDiT架构图像基础模型,在复杂文本渲染和精准图像生成领域取得重大突破。该模型不仅能实现多语言(包括字母文字和表意文字)的多行文本布局和段落级语义生成,还能保持编辑过程中的语...

Read More
2025-08-03 talkingdev

开源浏览器插件starchive-将YouTube视频自动发送到本地

近日,GitHub上出现了一个名为starchive的开源项目,该项目由开发者andrewarrow创建,主要功能是通过浏览器插件将YouTube视频自动发送到本地后端进行存档。这一工具的出现,为那些希望保存YouTube视频内容的用户提供...

Read More
2025-07-31 talkingdev

亚马逊投资AI初创公司Fable,推出用户自制剧集工具Showrunner

亚马逊近日投资了AI初创公司Fable,该公司推出的生成式AI工具Showrunner允许用户通过简单的提示词创建电视剧场景甚至完整剧集。Showrunner将在发布初期免费开放,但未来计划以每月10-20美元的价格提供订阅服务。Fabl...

Read More
2025-07-29 talkingdev

Grok即将推出无限图像生成和带声音视频生成功能

xAI公司正为其Grok应用程序准备多项重大更新,其中最引人注目的是Imagine功能,该功能将解锁Grok新的生成式AI模型,用于图像和视频的生成。Grok的图像和视频生成模型限制较少,一旦广泛推出,可能会引发病毒式传播。...

Read More
2025-07-28 talkingdev

Runway推出Aleph视频模型:支持高保真视频编辑与生成

Runway Research最新发布的Aleph视频模型标志着视频生成与编辑技术的重要突破。该模型具备上下文感知能力,可在视频中进行对象操作、视角转换、风格迁移和光照调整等高保真度编辑任务。其核心技术在于实现了对视频内...

Read More
2025-07-21 talkingdev

视频播客热潮兴起:研究显示75%听众观看视频内容,30%选择后台播放

《纽约时报》记者Joseph Bernstein的最新报道揭示了播客行业向视频化转型的显著趋势。据研究数据显示,约75%的播客消费者会播放视频版本的内容,而其中30%的用户倾向于将视频最小化或在后台播放。这一现象标志着传统...

Read More
2025-07-20 talkingdev

Dor Brothers视频工作室:仅用AI工具创作颠覆性内容,全网播放量破亿

记者Stuart A. Thompson深入报道了Dor Brothers视频工作室的创新实践。这个工作室通过完全依赖AI工具制作具有颠覆性的病毒式视频,在各大平台累计获得超过1亿次观看。报道中描述了一个标志性场景:前总统特朗普在豪...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page