大规模语言模型的相关内容 - 漫话开发者

2023-10-05 talkingdev

论文：LLMs中的知识编辑，大规模语言模型的知识编排之谜

将大规模语言模型（LLMs）比作一个庞大且复杂的拼图，每一块拼图都代表一份知识。这篇论文研究了我们尝试改变其中一些知识碎片会发生什么情况。结果可能会导致整个拼图被破坏，或者使其变得模糊不清。知识编辑在LLMs...

2023-05-30 talkingdev

近日，Sophia的官方实现已经上线，Sophia是一种可扩展的随机二阶优化器，用于语言模型预训练。以下是该实现的三个核心要点： - Sophia是一种适用于大规模语言模型预训练的随机二阶优化器； - Sophia的实现基于PyTor...