漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-28 talkingdev

《2025生成式媒体调查报告》发布:图像生成个人应用领先,企业投资回报周期缩短至12个月

最新发布的《2025生成式媒体调查报告》揭示了生成式媒体技术发展的关键趋势。报告显示,当前图像生成技术在个人用户中的普及度显著高于视频生成,其中谷歌Gemini系列模型在图像生成领域占据领先地位,而视频生成领域...

Read More
2025-10-23 talkingdev

World-in-World:首个闭环环境世界模型基准平台发布

近日,研究团队推出开创性基准平台World-in-World,这是首个专门针对闭环交互环境设计的开放评测框架。该平台突破传统世界模型仅关注视觉保真度的局限,将评估核心转向具身智能体在动态环境中的任务完成能力。通过构...

Read More
2025-10-23 talkingdev

Snapchat向全美用户免费开放首个AI提示词镜头,迎战Meta与OpenAI视频生成技术

Snapchat正式向美国所有用户免费开放其人工智能驱动的「Imagine Lens」功能,这标志着该平台首次将开放式提示词AI图像编辑工具从付费订阅模式转向全民普惠。该技术允许用户通过输入自定义文本指令,实时生成或编辑Sn...

Read More
2025-10-14 talkingdev

山寨Sora应用涌入苹果App Store,部分应用仍在架

在OpenAI正式发布其视频生成模型Sora后,苹果App Store迅速涌现出一批冒充Sora的山寨应用。这些应用通过规避苹果严格的审核机制成功上架,并在下架前获得了数十万次下载。这一事件暴露出应用商店审核体系存在漏洞,...

Read More
2025-10-10 talkingdev

开源|Sora MCP:为大型语言模型接入Sora视频生成能力

近日GitHub平台出现名为Sora MCP的开源项目,该项目通过构建MCP(模型控制协议)服务器,首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

Read More
2025-09-19 talkingdev

Luma AI推出Ray3视频生成器:具备'预思考'能力的新一代模型

人工智能视频生成领域迎来重大突破。Luma AI最新推出的Ray3视频生成模型采用革命性的'推理视频'架构,能够对复杂动作序列进行深度逻辑分析后再生成内容。该模型支持16位HDR高动态范围视频输出,在保持视觉保真度的同...

Read More
2025-09-16 talkingdev

开源|HuMo:文本、图像与音频驱动的统一人体视频生成框架

HuMo是一项突破性的人工智能技术,通过统一的多模态输入框架实现了人体视频生成的跨模态融合。该研究团队创新性地构建了大规模数据集并采用渐进式训练策略,成功解决了音频与视觉动作的时序同步难题。其技术核心在于...

Read More
2025-09-13 talkingdev

AI视频生成创企Higgsfield完成5000万美元A轮融资,GFT Ventures领投

专注于AI视频生成技术的初创公司Higgsfield.ai近日宣布成功完成5000万美元的A轮融资,本轮由GFT Ventures领投。该公司致力于通过人工智能技术革新视频内容创作流程,其技术可实现基于文本或图像的自动化视频生成,显...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page