视觉Transformer (ViT)已经成为视觉领域的主要研究方向,然而在它们的嵌入中,仍然有时会出现网格状的伪影。这使得社区在将其应用于下游任务时持怀疑态度。本研究提出了一种更新位置嵌入的方法,消除了这一问题,并...
Read More这项研究介绍了Zipformer,一种用于自动语音识别(ASR)的改进Transformer模型,它更快、占用更少内存,而且比广泛使用的Conformer效果更好。Zipformer是一种新型的语音识别模型,它使用了一种全新的架构,能够更快...
Read MoreOpenAI的ChatGPT是一款广受欢迎的聊天机器人,但最近发现这款机器人存在一些可以被绕过的限制。普遍的绕过方法是使用不太常见的语言,如祖鲁语和盖尔语。这种新的破解方式被称为‘Ukuhumusha’。根据研究人员的发现,C...
Read Moreragas是一个框架,它可以帮助你评估你的检索增强生成(Retrieval Augmented Generation,简称RAG)管道,这是一类使用外部数据来增强LLM(语言模型学习)上下文的应用程序。RAG管道是近年来人工智能领域的重要研究方...
Read More最近,研究人员发现文本图像模型(如Stable Diffusion)可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征,即表示相同的事物,例如人的鼻子,动物的耳朵,汽车的轮胎等。通过巧妙的算法,可以从各种图...
Read More