扩散模型的相关内容 - 漫话开发者

2023-10-31 talkingdev

微软研究小组开放GPT-3.5-turbo，参数达到20B

微软研究小组在一篇论文中提到，GPT-3.5-turbo（ChatGPT背后的模型）是一个具有20B参数的模型，该小组研究扩散模型用于代码。据称原始模型的参数为175B，因此可能进行了重新训练或蒸馏。

2023-10-27 talkingdev

最受欢迎的扩散模型，如稳定扩散，已经在各种数据上进行了训练，但其中很多数据受到不同的版权限制。MosaicML提出的这种新模型纯粹基于创意共享数据进行训练，其性能与SD2相当，并且只需要训练数据的一小部分。

2023-10-16 talkingdev

研究人员使用预训练的扩散模型在较小的图像上进行训练，以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题，并将问题指向了模型结构的有限感知能力。

2023-10-11 talkingdev

研究人员推出了一种用于文本生成中的扩散模型的新技术。通过使用软吸收状态，他们改善了模型处理离散文本变化的方式，从而加快了学习速度和采样速度。扩散模型是一种能够模拟物质扩散过程的数学模型，能够以一种高效...

2023-10-11 talkingdev

近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具，有效地将图像和视频输入转化为大型语言模型（LLM）的标记。使用MAGVIT-v2，LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容（如图像...

2023-09-30 talkingdev

RealFill是一个使用扩散模型进行图像修复的新算法。相比于传统的图像修复算法，RealFill能够更好地处理大尺寸的图像，并且修复后的图像质量更高。该算法基于扩散过程来填充缺失的像素。扩散过程考虑了像素之间的相关...

2023-09-28 talkingdev

利用RL调整语言模型正逐渐成为模型部署流程中的标准步骤。现在，这将通过扩散模型以及DRLX的发布变得更加容易，DRLX允许用户指定奖励模型或使用预定义的模型。扩散模型通过简化了RL在语言模型调整中的实现，为AI技术...

2023-09-21 talkingdev

丰田研究所(TRI)正在展示其在研究进展中如何在一夜之间教授机器人新技能。TRI运用传统的机器人学习技术和类似于生成AI模型的扩散模型。其系统已经针对60种技能进行了训练，主要关注在不同环境中的多功能性，目标是制...