模型的相关内容 - 漫话开发者

2023-10-06 talkingdev

Arc浏览器引入AI强化功能，实现更智能浏览体验

Arc浏览器近期推出了一项名为'Arc Max'的AI增强功能。这些功能利用了OpenAI的GPT-3.5以及Anthropic的模型，实现了如重命名固定标签页、概括链接内容以及根据文件内容重命名下载文件等功能。这一系列的AI增强功能不仅...

2023-10-05 talkingdev

将大规模语言模型（LLMs）比作一个庞大且复杂的拼图，每一块拼图都代表一份知识。这篇论文研究了我们尝试改变其中一些知识碎片会发生什么情况。结果可能会导致整个拼图被破坏，或者使其变得模糊不清。知识编辑在LLMs...

2023-10-05 talkingdev

最近的研究表明，为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明，将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理（仅解码器，最高可达10亿）的能力，最多可提高18%。直观上...

2023-10-05 talkingdev

SDXL是一种最先进的图像生成模型，虽然强大，但运行速度较慢。然而，Google与HuggingFace最近在Google的研究语言Jax中展示了它在新型TPU芯片上的运行速度。通过这种新的硬件加速，SDXL的性能得到了极大的提升，可以...

2023-10-05 talkingdev

试想一下，如果有一个模型既能理解和撰写文本，同时也能创作出匹配的图片，那将是多么的神奇。这就是新模型MiniGPT-5所能做到的。MiniGPT-5采用了一种被称为“生成vokens”的特殊技术来实现这一目标。所谓的“生成voken...

2023-10-05 talkingdev

本文研究了LLMs（大型语言模型）如何像社会中的人们一样协同工作。研究人员制造了具有不同个性的计算机“社会”，并观察他们如何在任务中协作，发现他们有时会像人类一样行为，比如跟随多数人的意见或进行辩论。有些团...

2023-10-04 talkingdev

AI生成技术正在重塑我们对大量数据收集的传统价值观。大型语言模型可以通过最小化的数据进行微调，甚至可以生成合成数据集，这使得专有数据的独特性和重要性可能正在逐渐减弱。在过去，我们通常认为数据量的大小和独...

2023-10-04 talkingdev

大多数自动驾驶系统都是基于规则的、专家系统和学习模块的大规模组合。Wayve公司的最新研究展示了一个具有90亿参数的联合视频、动作和文本模型，该模型在多样化的场景中表现出色。这个模型通过学习和理解大量的驾驶...