检索的相关内容 - 漫话开发者

2023-10-17 talkingdev

MemGPT：永久记忆聊天机器人开源

MemGPT允许开发者创建带有自我编辑记忆的永久聊天机器人。它智能地管理LLMs中的不同记忆层，以有效地提供扩展上下文。MemGPT知道何时将关键信息购买到向量数据库中，以及何时在聊天中检索它，从而实现永久对话。该存...

2023-09-25 talkingdev

检索是一种提高生成质量的方法。然而，嵌入查询和搜索往往较慢。本笔记本展示了一些巧妙的技巧，可以帮助提高检索性能。检索过程中的问题主要集中在嵌入查询和搜索上，这个过程往往效率低下。为了解决这个问题，我们...

2023-09-21 talkingdev

语言模型在处理实际查询时，经常出现虚构的细节。通过检索事实，我们可以减少这些不准确性。然而，将查询嵌入并对向量存储进行搜索的检索增强生成（RAG）的基础形式往往表现不佳。本文讨论了如何利用查询对象和信息...

2023-09-20 talkingdev

研究人员近日推出了一种名为DoLa的新方法，该方法能够帮助大型语言模型（例如与您进行聊天或撰写文章的模型）停止编造内容，而专注于事实。DoLa采用一种智能的方式比较模型内部的不同层次，以过滤出错误的信息。这是...

2023-09-20 talkingdev

Google的Bard聊天机器人现在可以通过扫描Gmail、Docs和Drive来检索信息和执行任务。Google表示，这些新的集成，被称作扩展，旨在节省用户在文档和邮件中寻找特定信息的时间。这一新的功能将大大提高用户的工作效率和...

2023-09-13 talkingdev

Arcus公司通过使用分层检索器将检索增强生成（RAG）技术扩展到行星级规模。这种技术是通过将文件基于其语义内容进行分组聚类，然后逐步过滤这些组来缩小搜索空间。这样可以检索到更相关的上下文，减少幻觉，并在行星...

2023-09-05 talkingdev

ragas是一个框架，它可以帮助你评估你的检索增强生成（Retrieval Augmented Generation，简称RAG）管道，这是一类使用外部数据来增强LLM（语言模型学习）上下文的应用程序。RAG管道是近年来人工智能领域的重要研究方...

2023-08-30 talkingdev

GitHub近日发布了新工具DSPy，这是一套简洁的Python模块集，能够统一调动和微调语言模型(LMs)的技术，并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现，同时也使得...

2023-08-21 talkingdev

对于大多数大型语言模型（LLM）应用，微调并非必要。使用少量提示或检索增强生成（RAG）可能是更好的选择。少量提示是指向LLM提供期望输出的示例，而RAG则涉及查询向量数据库，获取LLM未经训练的信息。这意味着，我...

2023-08-11 talkingdev

在一篇新的研究报告中，研究人员在聊天式提示中通过检索9个演示示例，使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重，但它使得与文本达芬奇-003模型相比，赢率增加了7倍，使其...