漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-26 talkingdev

基于GitHub Repo的Track Anything技术

- 利用Segment Anything和XMem技术实现,Track Anything技术可以灵活、可扩展地跟踪物体和视频。 - 可以利用Track Anything生成的掩模进行自动视频编辑、风格转换或视频识别任务。 - Track Anything技术基于GitHub R...

Read More
2023-04-18 talkingdev

Soundini:自然视频编辑的声音引导扩散技术

## 新闻内容: - 提出一种新方法,使用零样本声音引导视觉效果进行视频编辑,利用时间声音特征创建动态样式,同时保持时间一致性。 - 通过使用光流引导,引导去噪扩散概率模型与音频潜在表示相结合,该方法优于现有...

Read More
2023-04-17 talkingdev

VidStyleODE:神经-常微分方程技术实现视频编辑

新闻摘要: - VidStyleODE结合了StyleGAN和神经-常微分方程技术,实现了视频的分离表征,可以用于外观操作、运动操作、图像动画以及视频插值/外推等应用。 - VidStyleODE使得视频编辑变得更加容易和高效。 - VidSty...

Read More
2023-04-14 talkingdev

****

VidStyleODE让视频编辑更简单 **新闻内容:** VidStyleODE结合StyleGAN和Neural-ODE,实现了视频的分解式表示,可以实现外观操作、动作操作、图像动画和视频插值/外推等应用。 **核心要点:** - VidStyleODE结合了...

Read More
  1. Prev Page