漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

谷歌Veo:超一分钟的1080p分辨率视频生成新模型

谷歌Deepmind最近发布了一款名为Veo的新型视频生成人工智能模型。这款AI模型拥有强大的视频生成能力,能够生成具有1080p分辨率的视频,且长度可以超越一分钟。在现有的视频生成技术中,这种能力是相当显著的。Veo利...

Read More
2024-05-07 talkingdev

论文:利用遮蔽图像模型进行深度假象检测

最新的研究提出一种新的深度假象检测方法,这种方法主要关注于遮蔽图像模型,尤其是在频率域中。这种方法与传统的深度假象检测方法有所不同,对于识别由最新的AI生成技术制作的合成图像表现出显著的改进。遮蔽图像模...

Read More
2024-05-02 talkingdev

微梦想家算法驱动的3D生成技术

科研人员已经开发出一种名为微梦想家(MicroDreamer)的创新3D生成算法。这种算法通过降低所需函数评估的数量,显著加快了3D生成的过程。微梦想家算法采用先进的计算策略和优化技术,大大提升了3D建模和渲染的效率和...

Read More
2024-04-30 talkingdev

StoryDiffusion:远距离图像和视频生成技术

StoryDiffusion是一项新的机器学习技术,可用于生成具有长距离相关性的图像和视频。它使用了一种称为StoryGAN的生成模型,可以根据输入的故事情节和场景描述生成相关的图像和视频。这项技术有助于解决传统图像和视频...

Read More
2024-04-16 talkingdev

Adobe研发AI生成视频技术,即将集成至Premiere Pro

Adobe正在开发一项人工智能模型,用于生成视频内容,预计将于今年晚些时候集成到Premiere Pro中。该技术将具备添加、移除物体以及生成扩展内容的功能。目前,Adobe正在与第三方供应商合作,并通过对内容凭证的改进,...

Read More
2024-04-10 talkingdev

Visual Autoregressive Models:图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...

Read More
2024-04-09 talkingdev

论文:AI图像生成技术新突破,提示自动编辑技术助力文本到图像转换

近期,研究人员开发了一种名为提示自动编辑(Prompt Auto-Editing,简称PAE)的新技术,旨在提升基于文本生成图像的技术水平。该技术利用了Imagen和Stable Diffusion等扩散模型,通过在线强化学习动态调整文本提示中...

Read More
2024-04-04 talkingdev

Stability AI推出Stable Audio 2.0音乐生成模型

Stability AI近日宣布了其音乐生成模型的下一代产品——Stable Audio 2.0。该模型通过合法授权的音乐数据进行训练,能够生成长达3分钟的高质量音乐作品。Stable Audio 2.0还具备音频到音频的生成技术,这意味着用户可...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page