漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-23 talkingdev

sumtitup:一款免费开源的AI文本摘要器

名为“汇总一切”的产品是一款免费且开源的AI摘要器,无论是任何文本、文章,还是歌曲,它都可以进行有效的摘要。这款工具利用先进的人工智能技术,通过对输入的文本进行深度学习和理解,生成简洁、精炼的摘要。作为一...

Read More
2023-08-23 talkingdev

开源Whisper API:实现自我托管的语音转文本转录

近日,一个名为Whisper API的开源项目在GitHub上引起了广泛关注。该项目提供了一个自我托管的API,用于进行语音到文本的转录。这一切都是通过使用一个精心调整的Whisper自动语音识别模型来实现的。这个项目的出现将...

Read More
2023-08-21 talkingdev

论文:高效评估文字至图像生成的新方法

目前,评价从文本生成的图像质量的方法存在一些问题,如无法真实捕获图像的美观程度或与文本的匹配程度。最新的研究论文介绍了一种新的方法,该方法可以估计生成的图像与给定文本的匹配程度,重点关注图像的最重要部...

Read More
2023-08-15 talkingdev

Outlines:一种用于神经文本生成的开源库

Outlines是一个用于神经文本生成的库。它帮助开发人员通过与外部系统建立强大的接口来指导文本生成。Outlines与所有模型兼容,可以作为transformers库中generate方法的更灵活的替代品使用。

Read More
2023-08-11 talkingdev

论文:利用DETR改进3D物体检测的新方法

当前的3D物体检测器常常会误解数据,使其关注点距离目标物体较远。为了解决这个问题,一种名为“3D顶点相对位置编码”的新方法已经被开发出来。这种新方法可以引导检测器的注意力集中于靠近目标物体的点。这不仅提高了...

Read More
2023-08-11 talkingdev

论文:通过在上下文中学习提升Llama-2模型的性能

在一篇新的研究报告中,研究人员在聊天式提示中通过检索9个演示示例,使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重,但它使得与文本达芬奇-003模型相比,赢率增加了7倍,使其...

Read More
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-08-08 talkingdev

无分类器引导在HF变压器中的应用(GitHub拉取请求)

无分类器引导是一种引导模型生成的方式。它在图像生成中得到了广泛的应用。同时,它对于文本也同样适用,如今已被纳入Hugging Face模型的`.generate()`方法中。无分类器引导的工作原理是通过对模型的输出进行引导,...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page