漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-21 talkingdev

论文:高效评估文字至图像生成的新方法

目前,评价从文本生成的图像质量的方法存在一些问题,如无法真实捕获图像的美观程度或与文本的匹配程度。最新的研究论文介绍了一种新的方法,该方法可以估计生成的图像与给定文本的匹配程度,重点关注图像的最重要部...

Read More
2023-08-15 talkingdev

Outlines:一种用于神经文本生成的开源库

Outlines是一个用于神经文本生成的库。它帮助开发人员通过与外部系统建立强大的接口来指导文本生成。Outlines与所有模型兼容,可以作为transformers库中generate方法的更灵活的替代品使用。

Read More
2023-08-11 talkingdev

论文:利用DETR改进3D物体检测的新方法

当前的3D物体检测器常常会误解数据,使其关注点距离目标物体较远。为了解决这个问题,一种名为“3D顶点相对位置编码”的新方法已经被开发出来。这种新方法可以引导检测器的注意力集中于靠近目标物体的点。这不仅提高了...

Read More
2023-08-11 talkingdev

论文:通过在上下文中学习提升Llama-2模型的性能

在一篇新的研究报告中,研究人员在聊天式提示中通过检索9个演示示例,使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重,但它使得与文本达芬奇-003模型相比,赢率增加了7倍,使其...

Read More
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-08-08 talkingdev

无分类器引导在HF变压器中的应用(GitHub拉取请求)

无分类器引导是一种引导模型生成的方式。它在图像生成中得到了广泛的应用。同时,它对于文本也同样适用,如今已被纳入Hugging Face模型的`.generate()`方法中。无分类器引导的工作原理是通过对模型的输出进行引导,...

Read More
2023-08-03 talkingdev

LISA开源:通过LLM进行推理分割

这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...

Read More
2023-07-31 talkingdev

文字生成接口:Rust、Python和gRPC服务器的新型应用

HuggingFace公司最近在其文字生成接口(GitHub Repo)中进行了一次重要的许可证变更,该接口现在不再可用于商业用途。此接口是一个建立在Rust、Python和gRPC服务器上的文字生成推断系统,广泛应用于HuggingFace公司...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page