漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-02 talkingdev

开源|苹果发布STARFlow与STARFlow-V:基于Transformer自回归流的图像与视频生成新突破

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型,标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型,其核心在于巧妙地将自回归模型强大的表达能力与归...

Read More
2025-10-28 talkingdev

《2025生成式媒体调查报告》发布:图像生成个人应用领先,企业投资回报周期缩短至12个月

最新发布的《2025生成式媒体调查报告》揭示了生成式媒体技术发展的关键趋势。报告显示,当前图像生成技术在个人用户中的普及度显著高于视频生成,其中谷歌Gemini系列模型在图像生成领域占据领先地位,而视频生成领域...

Read More
2025-10-23 talkingdev

Snapchat向全美用户免费开放首个AI提示词镜头,迎战Meta与OpenAI视频生成技术

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能,这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令,实时生成或编辑Sn...

Read More
2025-09-19 talkingdev

Luma AI推出Ray3视频生成器:具备'预思考'能力的新一代模型

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构,能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出,在保持视觉保真度的同...

Read More
2025-07-30 talkingdev

Wan2.2:首个开源专家混合视频生成模型

Wan2.2项目在GitHub上发布了首个开源的专家混合(Mixture-of-Experts, MoE)视频生成模型,标志着视频生成技术领域的重要突破。该模型通过结合专家引导的扩散步骤和精细的电影级控制,显著提升了生成视频的质量和可...

Read More
2025-07-07 talkingdev

Character.AI突破性技术:TalkingMachines实现实时音频驱动视频生成

Character.AI最新推出的TalkingMachines技术标志着实时视频生成领域的重大突破。该技术通过先进的音频驱动视频生成模型,仅需单张静态图像和语音输入,即可实时生成类似FaceTime的动态视频动画。这一创新结合了深度...

Read More
2025-06-23 talkingdev

[开源]Frame Pack:像生成图像一样生成视频

Frame Pack是一种创新的视频生成方法,它通过利用图像潜在空间和巧妙的帧打包技术,显著降低了长视频生成的计算负担。该方法不仅实现了令人信服的生成效果,而且安装过程简便易行。Frame Pack的核心在于将视频帧视为...

Read More
2025-04-15 talkingdev

字节跳动团队发布Seaweed-7B:以低成本训练高性能视频生成基础模型

字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下,训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色,展现了强大的视频生成能力。这一突破不仅...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page