漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-14 talkingdev

DreamPose:通过稳定扩散实现时尚图像到视频合成

新闻内容: 通过DreamPose,我们可以实现以下三点核心功能: - DreamPose是基于扩散的图像到视频合成模型。 - 通过输入一个人物的图像和姿势序列,DreamPose可以合成一个逼真的视频,展示出输入人物按照姿势序列的...

Read More
2023-04-14 talkingdev

开源聊天机器人 Vicuna 击败 GPT-4 与 ChatGPT 相当

这篇论文介绍了 Vicuna-13B,一个利用 LLaMA 对用户分享的对话进行微调训练的开源聊天机器人。在超过 90% 的情况下,Vicuna-13B 的表现优于其他模型,如 LLaMA 和 Stanford Alpaca,并且在与 OpenAI ChatGPT 和 Goog...

Read More
2023-04-14 talkingdev

元宇宙公司发布儿童绘画数据集,开源并遵循隐私保护协议

元宇宙公司日前发布了一份儿童绘画数据集,并开源了其中的10万多个例子、动画代码、姿势寻找等内容。该数据集对于对自动化动画领域感兴趣的人非常有用。同时,该公司在筛选数据集时还采取了额外的隐私保护措施,以便...

Read More
2023-04-14 talkingdev

AdaM:自适应人像抠图技术,让视频处理更自然

以下是本文报道的主要内容: - AdaM是一种自适应人像抠图框架,适用于动态视频。 - AdaM通过编码器-解码器网络和转换器网络同时区分前景和背景,并捕捉多样化、非结构化视频中的阿尔法抠图细节,解决了无Trimap方法...

Read More
2023-04-14 talkingdev

****

VidStyleODE让视频编辑更简单 **新闻内容:** VidStyleODE结合StyleGAN和Neural-ODE,实现了视频的分解式表示,可以实现外观操作、动作操作、图像动画和视频插值/外推等应用。 **核心要点:** - VidStyleODE结合了...

Read More
2023-04-14 talkingdev

C-LoRA:解决文本到图像扩散模型中的“灾难性遗忘”问题

以下是新闻内容的核心要点: - 文本到图像扩散模型在定制化时面临“灾难性遗忘”的问题,导致过去概念的图像生成质量较差。 - 研究人员提出了 C-LoRA 方法,通过持续自我正则化低秩适应来克服这个问题,在持续扩散方...

Read More
2023-04-14 talkingdev

亚马逊推出AWS Bedrock服务,支持使用不同公司的基础模型

亚马逊宣布推出AWS Bedrock服务,该服务允许用户使用来自不同公司的基础模型,如Anthropic和Stability AI。用户只需将数据指向Amazon S3,即可使用开放模型。随着数据隐私和安全性的讨论越来越多,使用AWS基础设施在...

Read More
2023-04-14 talkingdev

利用LLM构建应用程序

本篇文章主要介绍了Chip Huyen的一些见解,它是她长篇有用内容系列中的又一篇。具体而言,有两个见解-使用LLMs轻松构建出令人惊叹的应用程序,但将其准备好投入生产却异常困难。这主要是由于自然语言的歧义性以及如...

Read More
  1. Prev Page
  2. 1081
  3. 1082
  4. 1083
  5. Next Page