漫话开发者 - UWL.ME

2023-04-14 talkingdev

DreamPose：通过稳定扩散实现时尚图像到视频合成

新闻内容：通过DreamPose，我们可以实现以下三点核心功能： - DreamPose是基于扩散的图像到视频合成模型。 - 通过输入一个人物的图像和姿势序列，DreamPose可以合成一个逼真的视频，展示出输入人物按照姿势序列的...

2023-04-14 talkingdev

这篇论文介绍了 Vicuna-13B，一个利用 LLaMA 对用户分享的对话进行微调训练的开源聊天机器人。在超过 90% 的情况下，Vicuna-13B 的表现优于其他模型，如 LLaMA 和 Stanford Alpaca，并且在与 OpenAI ChatGPT 和 Goog...

2023-04-14 talkingdev

元宇宙公司日前发布了一份儿童绘画数据集，并开源了其中的10万多个例子、动画代码、姿势寻找等内容。该数据集对于对自动化动画领域感兴趣的人非常有用。同时，该公司在筛选数据集时还采取了额外的隐私保护措施，以便...

2023-04-14 talkingdev

以下是本文报道的主要内容： - AdaM是一种自适应人像抠图框架，适用于动态视频。 - AdaM通过编码器-解码器网络和转换器网络同时区分前景和背景，并捕捉多样化、非结构化视频中的阿尔法抠图细节，解决了无Trimap方法...

2023-04-14 talkingdev

VidStyleODE让视频编辑更简单 **新闻内容：** VidStyleODE结合StyleGAN和Neural-ODE，实现了视频的分解式表示，可以实现外观操作、动作操作、图像动画和视频插值/外推等应用。 **核心要点：** - VidStyleODE结合了...

2023-04-14 talkingdev

以下是新闻内容的核心要点： - 文本到图像扩散模型在定制化时面临“灾难性遗忘”的问题，导致过去概念的图像生成质量较差。 - 研究人员提出了 C-LoRA 方法，通过持续自我正则化低秩适应来克服这个问题，在持续扩散方...

2023-04-14 talkingdev

亚马逊宣布推出AWS Bedrock服务，该服务允许用户使用来自不同公司的基础模型，如Anthropic和Stability AI。用户只需将数据指向Amazon S3，即可使用开放模型。随着数据隐私和安全性的讨论越来越多，使用AWS基础设施在...

2023-04-14 talkingdev

本篇文章主要介绍了Chip Huyen的一些见解，它是她长篇有用内容系列中的又一篇。具体而言，有两个见解-使用LLMs轻松构建出令人惊叹的应用程序，但将其准备好投入生产却异常困难。这主要是由于自然语言的歧义性以及如...