LLM的相关内容 - 漫话开发者

2023-06-27 talkingdev

Kor：利用LLMs从文本中提取结构化数据

Kor是一种新的技术，它利用LLMs（Language Learning Models）从文本中提取结构化数据。LLMs是一种能够理解和处理自然语言的模型，它们可以对文本进行深度分析，找出其中的关键信息和结构。Kor通过使用LLMs，可以将文...

2023-06-23 talkingdev

这项研究揭示了大型语言模型（LLMs）在处理不同任务时可以胜任，但在概率推理方面存在困难，从而限制了它们的性能。作者提出了一种名为Tart的解决方案 - 一种在通用方式下训练的推理模块，当与任何现有模型结合时，...

2023-06-21 talkingdev

Autolabel是一个Python库，可以使用你选择的任何大型语言模型（LLM）来标注、清理和丰富文本数据集。

2023-06-21 talkingdev

这项研究介绍了LOw-Memory Optimization（LOMO），这是一种旨在显著减少大型语言模型（LLM）训练所需资源的优化器，目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU（每个具有24...

2023-06-21 talkingdev

这篇文章由a16z撰写，讨论了一些新兴的LLM应用架构，包括联邦学习、边缘计算和无服务器计算。这些架构为LLM提供了新的扩展方式和更高效的运行方式，可能会在未来推动LLM的广泛应用。

2023-06-19 talkingdev

本文讨论了几种加速大型语言模型（LLM）训练和推理的技术，以使用高达100K个输入令牌的大上下文窗口。这些技术包括：ALiBi位置嵌入，稀疏注意力，闪电注意力，多查询注意力，条件计算以及使用80GB的A100 GPU。

2023-06-17 talkingdev

人工智能编码助手在构建多个规范之间的兼容性层面上表现出色。

2023-06-13 talkingdev

最近，关于语言模型的热潮导致了各种各样的声明，比如“我们的模型被 ChatGPT N% 的时间所偏好”。但这种声明通常隐藏了一个事实，那就是 ChatGPT 实际上是偏向 GPT4 模型的。这其中涉及到各种各样的问题，包括校准、...