Meta发布新型文本-图像-文本模型
talkingdev • 2023-07-17
1600585 views
Meta最近发布了一种新型模型,该模型的工作原理与GPT系列的解码器仅Transformer相似,都是一次预测一个令牌。然而,如果你将交错的文本和图像视为令牌,这种模型就可以从文本生成图像,反之亦然。更令人惊奇的是,该模型还能生成手部图像。这个创新的模型开启了一种全新的视觉和文字交互方式,预示着AI技术在理解和创造视觉内容方面的巨大潜力。
核心要点
- Meta发布了一种新型文本-图像-文本模型。
- 该模型的工作原理与GPT系列的解码器仅Transformer相似,一次预测一个令牌。
- 这种模型可以从文本生成图像,反之亦然,甚至可以生成手部图像。