MemGPT允许开发者创建带有自我编辑记忆的永久聊天机器人。它智能地管理LLMs中的不同记忆层,以有效地提供扩展上下文。MemGPT知道何时将关键信息购买到向量数据库中,以及何时在聊天中检索它,从而实现永久对话。该存...
Read More检索是一种提高生成质量的方法。然而,嵌入查询和搜索往往较慢。本笔记本展示了一些巧妙的技巧,可以帮助提高检索性能。检索过程中的问题主要集中在嵌入查询和搜索上,这个过程往往效率低下。为了解决这个问题,我们...
Read More语言模型在处理实际查询时,经常出现虚构的细节。通过检索事实,我们可以减少这些不准确性。然而,将查询嵌入并对向量存储进行搜索的检索增强生成(RAG)的基础形式往往表现不佳。本文讨论了如何利用查询对象和信息...
Read More研究人员近日推出了一种名为DoLa的新方法,该方法能够帮助大型语言模型(例如与您进行聊天或撰写文章的模型)停止编造内容,而专注于事实。DoLa采用一种智能的方式比较模型内部的不同层次,以过滤出错误的信息。这是...
Read MoreGoogle的Bard聊天机器人现在可以通过扫描Gmail、Docs和Drive来检索信息和执行任务。Google表示,这些新的集成,被称作扩展,旨在节省用户在文档和邮件中寻找特定信息的时间。这一新的功能将大大提高用户的工作效率和...
Read MoreArcus公司通过使用分层检索器将检索增强生成(RAG)技术扩展到行星级规模。这种技术是通过将文件基于其语义内容进行分组聚类,然后逐步过滤这些组来缩小搜索空间。这样可以检索到更相关的上下文,减少幻觉,并在行星...
Read Moreragas是一个框架,它可以帮助你评估你的检索增强生成(Retrieval Augmented Generation,简称RAG)管道,这是一类使用外部数据来增强LLM(语言模型学习)上下文的应用程序。RAG管道是近年来人工智能领域的重要研究方...
Read MoreGitHub近日发布了新工具DSPy,这是一套简洁的Python模块集,能够统一调动和微调语言模型(LMs)的技术,并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现,同时也使得...
Read More对于大多数大型语言模型(LLM)应用,微调并非必要。使用少量提示或检索增强生成(RAG)可能是更好的选择。少量提示是指向LLM提供期望输出的示例,而RAG则涉及查询向量数据库,获取LLM未经训练的信息。这意味着,我...
Read More在一篇新的研究报告中,研究人员在聊天式提示中通过检索9个演示示例,使用预训练的Llama-2语言模型进行了在上下文中的学习。这种方法并没有改变模型的权重,但它使得与文本达芬奇-003模型相比,赢率增加了7倍,使其...
Read More