这个GitHub仓库公布了两个重要贡献:RDVS数据集,包含丰富多样的RGB-D视频场景,以及DCTNet+,一种专门用于RGB-D视频对象检测的网络,配备了创新功能,以精确预测和改进现有模型的性能。
Read MoreMotionEditor是一种专为视频运动编辑而设计的扩散模型,巧妙地平衡了运动操作和原始内容保护。它引入了一种内容感知运动适配器和一个独特的双分支架构,注入注意力,使得编辑后的运动无缝集成,同时保持原始背景和主...
Read More本项目提出了“可动态高斯化”技术,这是一种将2D CNN和3D高斯点转换技术结合起来的新技术,可以从视频中创建更逼真、更详细的人物头像。这种技术不仅可以用于游戏、虚拟现实等领域,还可以在电影、电视和广告等领域中...
Read MoreDiffSLVA是一种创新的手语视频匿名化方法,可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块,克服了以前的限制,不需要精确的姿势估计。
Read MoreStableVSR是一种新颖的视频超分辨率(VSR)方法,利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比,StableVSR可以更好地处理不同的噪声和失真情况,并且在不需要额外训练数据的情况下也...
Read MoreStability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。
Read MoreKandinsky Video采用双阶段文本到视频生成技术。首先,它通过关键帧来勾勒视频的故事情节,然后平滑过渡和移动,大大提高了视频质量并降低了计算要求。
Read More本次大型语言模型介绍将讨论它们是什么,它们的发展方向,与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分,近年来得到了广泛关注和应用。它们的出现...
Read MoreStability AI推出的Stable Video可以生成14帧视频,展示了内容创作的未来方向。该技术可以通过对少量关键帧的学习,生成完整的视频帧。通过这种方式,Stable Video为内容创作者提供了更高效的内容创作方式,并且大大...
Read More