语言模型的相关内容 - 漫话开发者

2023-08-09 talkingdev

评估大型语言模型作为代理的能力：AgentBench工具

该项目引入了AgentBench，一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中，结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...

2023-08-09 talkingdev

Humanscript是一种脚本解释器，利用大型语言模型推断自然语言编写的命令背后的含义。这种解释器的出现，开启了人机交互新纪元，让机器更好地理解并执行人类的语言命令。Humanscript的最大特点在于，它能够理解并执行...

2023-08-09 talkingdev

稳定性AI公司近日公开发布了一款名为StableCode的新型开源大语言模型。该模型的主要设计目标是助力用户生成编程语言代码。StableCode的发布旨在改进和简化编程语言代码的生成过程，从而进一步优化编程体验，提高代码...

2023-08-08 talkingdev

MM-Vet是一种新的工具，用于测试大型语言模型(LLMs)处理涉及图像和文字的任务的能力，例如从照片中解决数学问题或解释图片中的笑话。这种工具的出现，为我们提供了一个全新的角度去评估和理解LLMs在图像和文字处理方...

2023-08-07 talkingdev

目前使用的语言模型有两大类：密集型和稀疏型。密集型模型就像传统的2017年的变压器模型，每个令牌都使用每个模型参数。稀疏型模型在此后不久就被引入，它使用一种路由机制（通常是学习到的），这意味着每个令牌只使...

2023-08-07 talkingdev

最近，一篇论文的作者们开发出了一种名为“共思”的方法，该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集，并以RoBERTa的方式训练较小的模型，使得该模型在语言测...

2023-08-07 talkingdev

一项最新研究介绍了PerceptionCLIP，这是一种模拟人类视觉感知过程的两步图像分类方法，旨在更好地利用CLIP，一种突出的视觉语言模型。首先，通过识别背景属性并利用它们区分前景物体，这种新方法在图像分类任务中提...

2023-08-07 talkingdev

图像分割是一种将图像中属于对象的每个区域进行标记的过程，这比传统的分类问题要复杂得多。而且，如果没有预定义的对象列表，进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...