近期的一项研究介绍了一种名为MAGVIT-v2的视频标记化工具,有效地将图像和视频输入转化为大型语言模型(LLM)的标记。使用MAGVIT-v2,LLM在视觉生成任务中的表现超过了扩散模型。视频标记化是一种将视觉内容(如图像...
Read More本文研究了LLMs(大型语言模型)如何像社会中的人们一样协同工作。研究人员制造了具有不同个性的计算机“社会”,并观察他们如何在任务中协作,发现他们有时会像人类一样行为,比如跟随多数人的意见或进行辩论。有些团...
Read MoreAI生成技术正在重塑我们对大量数据收集的传统价值观。大型语言模型可以通过最小化的数据进行微调,甚至可以生成合成数据集,这使得专有数据的独特性和重要性可能正在逐渐减弱。在过去,我们通常认为数据量的大小和独...
Read More多模态大型语言模型在许多任务中表现优秀,但在定位图像中的特定对象方面往往存在困难。为了改善这一问题,研究人员已经开发出一种新的方法:将物体的位置转化为文本,并通过特殊任务进行模型的训练。这种方法的出现...
Read MoreDeepMind的大型语言模型Chinchilla 70B可以将图像进行无损压缩,使其仅占原始大小的43.4%,并将音频数据压缩到仅占原始大小的16.4%。
Read More大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...
Read More本文探讨了在中期未来,由大型语言模型驱动的软件可能会是什么样子。语言模型将会显著改变我们与计算机的交互方式。当前的技术状态看似初级,但越来越明显的是,生成型人工智能无法完全替代过去几十年里出现的其他用...
Read More这项研究的重点是使已经擅长理解和生成文本的大型语言模型,在回答医学问题方面表现得更好。大型语言模型(LLMs)已经在很多领域包括医学领域显示出了巨大的潜力,然而,尽管如此,它们在理解和回答具体的医学问题方...
Read More