漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-08 talkingdev

MM-Vet:多模态LLMs测试工具

MM-Vet是一种新的工具,用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力,例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现,为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

Read More
2023-08-07 talkingdev

什么是MOE混合专家模型?

目前使用的语言模型有两大类:密集型和稀疏型。密集型模型就像传统的2017年的变压器模型,每个令牌都使用每个模型参数。稀疏型模型在此后不久就被引入,它使用一种路由机制(通常是学习到的),这意味着每个令牌只使...

Read More
2023-08-07 talkingdev

论文:利用LLM技术提升婴儿级语言模型的性能

最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...

Read More
2023-08-07 talkingdev

PerceptionCLIP,开源增强zero-shot击图像分类方法

一项最新研究介绍了PerceptionCLIP,这是一种模拟人类视觉感知过程的两步图像分类方法,旨在更好地利用CLIP,一种突出的视觉语言模型。首先,通过识别背景属性并利用它们区分前景物体,这种新方法在图像分类任务中提...

Read More
2023-08-07 talkingdev

LISA推出推理分割技术 - LLMS

图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...

Read More
2023-08-07 talkingdev

开源模型Functionary:可解析并执行函数/插件

近日,GitHub发布了一种名为Functionary的新型语言模型,这种模型具有解读和执行函数/插件的能力,可以准确地判断何时执行一个函数,并能理解其输出结果。Functionary只在需要的时候触发函数,从而大大提高了代码运...

Read More
2023-08-04 talkingdev

OpenAI申请GPT-5商标,推出新型语言模型软件

OpenAI近日正式向美国专利和商标局提交了GPT-5商标的申请。根据申请文件的描述,GPT-5被定义为一款全新的可下载的计算机软件,用于使用语言模型。这一消息引发了业界广泛关注,因为OpenAI的GPT系列语言模型已经在全...

Read More
2023-08-04 talkingdev

论文:提升大型语言模型的错误识别能力

最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...

Read More
  1. Prev Page
  2. 113
  3. 114
  4. 115
  5. Next Page