漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-10 talkingdev

开源|Sora MCP:为大型语言模型接入Sora视频生成能力

近日GitHub平台出现名为Sora MCP的开源项目,该项目通过构建MCP(模型控制协议)服务器,首次实现大型语言模型直接调用Sora视频生成API的技术突破。该工具使LLMs具备创建Sora视频、实时查询生成状态、将生成视频下载...

Read More
2025-04-25 talkingdev

Adobe重磅推出Firefly升级版:统一图像、视频、音频及矢量生成工具

Adobe近日发布了Firefly的重大更新,此次更新不仅整合了图像、视频、音频及矢量生成工具,还新增了移动端支持,并进一步深化了与Creative Cloud的集成。这一举措标志着Adobe在创意AI领域的又一重要突破,为设计师和...

Read More
2024-05-14 talkingdev

Text-Image组合与理解:InternLM-XComposer2视觉语言模型的突破

InternLM-XComposer2是一种在创建和理解复杂的文本-图像内容方面表现优异的视觉语言模型。该模型引入了一种名为Partial LoRA的新型方法,用以平衡视觉和文本的理解,其性能超越了现有的多模态内容创建和理解模型。通...

Read More