MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...
Read More目前使用的语言模型有两大类:密集型和稀疏型。密集型模型就像传统的2017年的变压器模型,每个令牌都使用每个模型参数。稀疏型模型在此后不久就被引入,它使用一种路由机制(通常是学习到的),这意味着每个令牌只使...
Read More最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...
Read More一项最新研究介绍了PerceptionCLIP,这是一种模拟人类视觉感知过程的两步图像分类方法,旨在更好地利用CLIP,一种突出的视觉语言模型。首先,通过识别背景属性并利用它们区分前景物体,这种新方法在图像分类任务中提...
Read More图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...
Read More近日,GitHub发布了一种名为Functionary的新型语言模型,这种模型具有解读和执行函数/插件的能力,可以准确地判断何时执行一个函数,并能理解其输出结果。Functionary只在需要的时候触发函数,从而大大提高了代码运...
Read MoreOpenAI近日正式向美国专利和商标局提交了GPT-5商标的申请。根据申请文件的描述,GPT-5被定义为一款全新的可下载的计算机软件,用于使用语言模型。这一消息引发了业界广泛关注,因为OpenAI的GPT系列语言模型已经在全...
Read More最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...
Read More