研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...
Read More研究人员推出了一种名为FAVOR的新方法,该方法通过在帧级别精细融合音频和视觉细节,使大型语言模型能够理解视频。FAVOR方法的推出,为大型语言模型的视频理解能力提供了新的发展空间。这种新方法通过在帧级别精细融...
Read More研究员们创造了一款名为AucArena的模拟平台,旨在在拍卖环境中测试大型语言模型。这些环境是动态的,需要策略性思考。初步测试显示,如果给出合适的提示,这些模型可以在拍卖中表现出色,表现出诸如预算和长期计划等...
Read More近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具,有效地将图像和视频输入转化为大型语言模型(LLM)的标记。使用MAGVIT-v2,LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容(如图像...
Read More本文研究了LLMs(大型语言模型)如何像社会中的人们一样协同工作。研究人员制造了具有不同个性的计算机“社会”,并观察他们如何在任务中协作,发现他们有时会像人类一样行为,比如跟随多数人的意见或进行辩论。有些团...
Read MoreAI生成技术正在重塑我们对大量数据收集的传统价值观。大型语言模型可以通过最小化的数据进行微调,甚至可以生成合成数据集,这使得专有数据的独特性和重要性可能正在逐渐减弱。在过去,我们通常认为数据量的大小和独...
Read More多模态大型语言模型在许多任务中表现优秀,但在定位图像中的特定对象方面往往存在困难。为了改善这一问题,研究人员已经开发出一种新的方法:将物体的位置转化为文本,并通过特殊任务进行模型的训练。这种方法的出现...
Read MoreDeepMind的大型语言模型Chinchilla 70B可以将图像进行无损压缩,使其仅占原始大小的43.4%,并将音频数据压缩到仅占原始大小的16.4%。
Read More大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...
Read More本文探讨了在中期未来,由大型语言模型驱动的软件可能会是什么样子。语言模型将会显著改变我们与计算机的交互方式。当前的技术状态看似初级,但越来越明显的是,生成型人工智能无法完全替代过去几十年里出现的其他用...
Read More