漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-10 talkingdev

iChat:增强与聊天机器人交互的新视觉框架

研究人员开发了一种名为InternChat (iChat) 的工具,将强大的聊天机器人(如ChatGPT)与指向性动作等非语言提示相结合,使用户可以直接操作图像或视频。通过将手势添加到语言中,iChat使与聊天机器人的交流更高效、...

Read More
2023-05-10 talkingdev

把基础模型转化为聊天助手

Star coder是一个来自大型代码项目的出色新模型,它可以编写86种不同的编程语言。本文探讨了如何促使模型参与对话,如何使用聊天标记语言,甚至如何调整这些模型。对于那些有兴趣采取开源模型并为自己的基于聊天的用...

Read More
2023-05-05 talkingdev

利用字体颜色控制图像生成技术的研究

研究人员调查了在富文本中发现的各种格式元素(例如字体大小、颜色、样式和脚注)的使用,以生成从文本到图像的过程。他们的方法允许轻松控制本地样式、准确地创建颜色,并在处理长文本提示时提供额外信息。通过利用...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
2023-05-04 talkingdev

小模型备受欢迎,但能追赶上大模型吗?

在自然语言处理中,大型语言模型的推理能力往往比小型模型更强。这种推理能力有助于解决困难的任务,并可能使语言模型成为下一代计算平台/操作系统的基础。通过代码训练、思维链提示和强化学习等技术,可以提高模型...

Read More
2023-05-03 talkingdev

GPT四家教控制现已发布

GitHub上发布了GPT四家教控制的仓库,这个仓库可以让你的语言模型变成一个家教,从而帮助你更好地学习。以下是该教程的主要内容: - GPT四家教控制是一个基于DAN破解的聊天bot,它可以根据提示变成家教角色; - Mr....

Read More
2023-04-28 talkingdev

TextDeformer:使用文本引导进行几何形变

该研究介绍了一种技术,可以根据文本提示自动变形三角网格,利用可微分渲染和预训练图像编码器,如CLIP和DINO。通过使用雅可比矩阵进行网格变形表示,该方法实现了平滑变形,并避免了噪声梯度,从而实现了大的形状变...

Read More
2023-04-27 talkingdev

深度学习模型 DeepFloyd IF 能够根据文本提示生成高质量图片

深度学习模型 DeepFloyd IF 是一种模块化的模型,旨在根据文本提示生成高质量的图像。该基础模型可以创建 64x64 像素的图像,而两个超分辨率模型可以创建 256x256 像素和 1024x1024 像素版本的图像。在 COCO 数据集...

Read More
2023-04-27 talkingdev

DeepFloyd IF代码发布

- Stability AI发布了下一代图像模型代码 - 模型是一个多阶段模型,具有冻结的T5文本编码器和两个超分辨率模型 - 模型能够呈现极高质量的文本,可能首先只面向研究,但会在社区反馈后开放。 深度学习模型 DeepFloyd...

Read More
2023-04-26 talkingdev

一分钟读懂SA3D:3D分割新框架发布

以下是该新闻的三个核心要点: - SA3D是一个新颖的框架,可用于一次性3D分割,使用神经辐射场,在最小的手动提示下,使用户能够在渲染视图中分割目标物体。 - 迭代过程使用2D掩模、密度引导反向渲染和交叉视图自我...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page