漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-20 talkingdev

基于文本指令的图像编辑大规模数据集发布

MAGICBRUSH是一个独特的、大规模的数据集,可帮助通过文本指令进行图像编辑,改进了过去容易出错且需要大量手动调整的方法。MAGICBRUSH包含超过10,000个图像及其文本指令的示例,已用于训练InstructPix2Pix图像编辑...

Read More
2023-06-05 talkingdev

谷歌推出生成式AI课程

## 新闻内容: - 虽然这个领域正在快速发展,但生成式机器学习的基础已经相当稳固。 - 这个由9部分组成的课程涵盖了很多内容,适合对该领域感兴趣的人学习。 - 最终目标是将新用户引入他们的ML云产品Vertex。即使如...

Read More
2023-05-30 talkingdev

Nvidia展示新技术,让你用自己的声音与AI游戏角色交流

Nvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...

Read More
2023-05-12 talkingdev

用AI和素描创造更好的视频内容

近日,有一篇论文介绍了一种使用人工智能(AI)和文本生成视频内容的新方法。这种方法将两种技术——Text-to-Video Zero和ControlNet结合在一起,可以创建高质量的、与用户意图非常接近的一致性视频,多次实验证明其效...

Read More
2023-04-28 talkingdev

TextDeformer:使用文本引导进行几何形变

该研究介绍了一种技术,可以根据文本提示自动变形三角网格,利用可微分渲染和预训练图像编码器,如CLIP和DINO。通过使用雅可比矩阵进行网格变形表示,该方法实现了平滑变形,并避免了噪声梯度,从而实现了大的形状变...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21