漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-19 talkingdev

改善视频深度稳定性的新型工具(GitHub Repo)

最近,一篇新的研究论文介绍了一种名为“神经视频深度稳定器”的新方法,可以在视频中提供一致且准确的深度估计。同时,研究团队还发布了有史以来最大的自然场景视频深度数据集,名为“野生视频深度”。通过这种新的方法...

Read More
2023-07-19 talkingdev

预训练模型模仿人类行为:图像协调新方法(GitHub仓库)

这篇论文提出了一种新的图像协调方法,不同于以往的方法,这种方法并不依赖于大量的合成图像,这使得其训练成本更低,更具泛化性。在以往的方法中,需要大量的合成图像来训练模型,而这篇论文提出的方法,通过预训练...

Read More
2023-07-18 talkingdev

将故事变成电影:一种创新的文本到视频合成框架

这个项目引入了一种突破性的方法,可以通过根据故事情节定制现有视频剪辑的外观,将文字故事转化为连贯的视频。这个新的框架使用先进的算法和技术,能够理解故事的文本内容,然后通过分析和解析文本中的关键信息,将...

Read More
2023-07-12 talkingdev

TIM新方法提升机器翻译性能,表现超过现有技术

研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...

Read More
2023-07-12 talkingdev

FreeDrag:更准确的图像编辑方法,解决DragGAN的准确性问题

近期,研究者们推出了名为FreeDrag的图像编辑新方法,以解决前一模型DragGAN在跟踪点位准确性上常出现的问题。经过一系列实验,研究者们发现,FreeDrag的全新特性导向方式,采用自适应模板特性、线性搜索以及模糊定...

Read More
2023-07-10 talkingdev

无需强化学习环节的逆向强化学习:快速且稳健

逆向强化学习有时被称为行为克隆或专家模仿。它通过引入一个内部强化学习环路,将监督调优的简单任务变得复杂。然而,如果我们去掉这个环路,我们可以获得强化学习探索的许多优势,同时避免了函数近似问题的挑战。这...

Read More
2023-07-08 talkingdev

DragonDiffusion:一种采用特征对应提高文本到图像编辑精度的新方法

DragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...

Read More
2023-07-04 talkingdev

人脑活动的潜在扩散模型实现高分辨率图像重建

研究人员提出了一种新的方法,使用一种扩散模型,具体来说是一种名为稳定扩散的潜在扩散模型(LDM),从通过fMRI捕获的人脑活动中重建高分辨率、高保真度的图像。该方法在保持生成性能的同时减少了计算成本,无需对...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30
  5. Next Page