视频的相关内容 - 漫话开发者

2023-12-07 talkingdev

RGB-D视频中显著对象检测得到提升

这个GitHub仓库公布了两个重要贡献：RDVS数据集，包含丰富多样的RGB-D视频场景，以及DCTNet+，一种专门用于RGB-D视频对象检测的网络，配备了创新功能，以精确预测和改进现有模型的性能。

2023-12-06 talkingdev

MotionEditor是一种专为视频运动编辑而设计的扩散模型，巧妙地平衡了运动操作和原始内容保护。它引入了一种内容感知运动适配器和一个独特的双分支架构，注入注意力，使得编辑后的运动无缝集成，同时保持原始背景和主...

2023-12-05 talkingdev

MaXTron是一种简单而有效的统一元架构，用于视频分割。

2023-11-30 talkingdev

本项目提出了“可动态高斯化”技术，这是一种将2D CNN和3D高斯点转换技术结合起来的新技术，可以从视频中创建更逼真、更详细的人物头像。这种技术不仅可以用于游戏、虚拟现实等领域，还可以在电影、电视和广告等领域中...

2023-11-30 talkingdev

DiffSLVA是一种创新的手语视频匿名化方法，可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块，克服了以前的限制，不需要精确的姿势估计。

2023-11-30 talkingdev

StableVSR是一种新颖的视频超分辨率（VSR）方法，利用扩散模型和时间条件模块来提高放大视频的质量。与基于深度学习的方法相比，StableVSR可以更好地处理不同的噪声和失真情况，并且在不需要额外训练数据的情况下也...

2023-11-29 talkingdev

Stability AI宣布其开源模型组合中将新增稳定视频传输技术Stable Video Diffusion。其AI模型组合已经涵盖了图像、语言、音频、3D和代码等多种模态。

2023-11-28 talkingdev

Kandinsky Video采用双阶段文本到视频生成技术。首先，它通过关键帧来勾勒视频的故事情节，然后平滑过渡和移动，大大提高了视频质量并降低了计算要求。

2023-11-24 talkingdev

本次大型语言模型介绍将讨论它们是什么，它们的发展方向，与现有操作系统的比较和类比以及该领域的一些安全相关挑战。大型语言模型是如今人工智能研究中一个非常重要的部分，近年来得到了广泛关注和应用。它们的出现...

2023-11-23 talkingdev

Stability AI推出的Stable Video可以生成14帧视频，展示了内容创作的未来方向。该技术可以通过对少量关键帧的学习，生成完整的视频帧。通过这种方式，Stable Video为内容创作者提供了更高效的内容创作方式，并且大大...