漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-28 talkingdev

通义千问VLo:从“理解”世界到“描绘”世界

多模态大模型的演进不断突破我们对技术能力的认知边界。从最初的QwenVL到最新的Qwen2.5 VL,研究团队在提升模型理解图像内容的能力方面取得了显著进展。如今,团队正式推出全新模型Qwen VLo,这是一个统一的多模态理...

Read More
2025-06-25 talkingdev

[论文推荐]ContinualFlow:生成模型中的持续流优化技术

近日,一项名为ContinualFlow的创新技术为生成模型领域带来突破性进展。该技术通过流向能量重加权目标的匹配方法,直接从模型分布中剔除不需要的区域,从而避免了传统方法所需的完整模型重新训练过程。这一技术的核...

Read More
2025-06-20 talkingdev

Refine AI推出企业级应用开发工具Vibe Code,助力快速构建React管理面板与自动化界面

人工智能开发平台Refine AI近日推出企业级内部应用构建工具Vibe Code,该工具允许用户通过自然语言描述需求,结合业务和技术背景,自动生成基于React的管理面板、仪表盘或图形用户界面自动化系统。这一创新将显著降...

Read More
2025-06-19 talkingdev

Midjourney发布首款AI视频生成模型V1,开启图像转视频新纪元

Midjourney公司正式推出其首款AI视频生成模型V1,该模型能够将任意静态图像转化为5秒的动态视频,标志着AI在多媒体内容生成领域的又一重大突破。尽管目前仅支持通过Discord平台使用,但其技术潜力不容小觑。据公司透...

Read More
2025-06-13 talkingdev

Bria 3.2新一代AI图像模型开放早期体验:100%合规数据训练,突破文本渲染技术

Bria最新发布的3.2版本AI图像生成模型在文本渲染领域实现技术突破,该模型采用100%经过授权的合规数据进行训练,为企业用户提供符合知识产权法规的AI解决方案。这一创新显著提升了生成图像中文本元素的准确性和自然...

Read More
2025-06-13 talkingdev

字节跳动Seedance 1.0登顶视频生成基准测试,超越谷歌Veo 3与OpenAI Sora

字节跳动旗下TikTok母公司最新发布的Seedance 1.0模型在文本生成视频(text-to-video)和图像生成视频(image-to-video)两项核心任务中均位列榜首,其性能表现超越谷歌Veo 3与OpenAI Sora等业界标杆。该模型仅需41...

Read More
2025-05-29 talkingdev

PixelFlow开源-直接在像素空间生成高质量图像

PixelFlow是近期在GitHub上开源的一个创新图像生成模型,其最大特点是直接在像素空间生成图像,无需依赖变分自编码器(VAE)。这一技术突破带来了显著的图像质量提升和更精细的语义控制能力,同时在生成效率和基准测...

Read More
2025-05-27 talkingdev

FoD提出前向扩散生成模型框架:仅需前向步骤实现高效图像生成

近日,FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架(Forward-Only Diffusion)。该技术突破性地实现了非马尔可夫采样过程,在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page