检索的相关内容 - 漫话开发者

2024-06-19 talkingdev

论文：使用ERASE更新语言模型

ERASE是一种全新的更新语言模型的方法。这种方法与传统的注重在预测过程中提高检索效率的方法有所不同，ERASE在新的文档被添加时，会逐步删除或重写知识库中的条目。这种方法的出现，为语言模型的更新提供了一种全新...

2024-06-08 talkingdev

在自然语言处理（NLP）中，分块是指将句子分成更小的组块（块）的过程，每个块都有自己的语法和含义。在RAG（Retrieval-Augmented Generation）应用程序中，分块是生成响应的重要步骤。不同于传统的基于规则或基于统...

2024-05-30 talkingdev

在信息检索中，RAG模型是一种常见的评估信息检索系统的方法。近日，研究人员提出了一种新的RAG模型改进方法，即使用互惠排名融合和混合搜索。在实验中，该方法比传统的RAG模型表现更好，大幅提高了搜索结果的质量和...

2024-05-30 talkingdev

随着人工智能产品的门槛降低，从演示到实现有效产品的转变依然充满挑战。这一系列文章将深入探讨过去一年中基于机器学习系统之上开发实际应用的人们，从大型语言模型（LLMs）产品开发中学到的关键教训和方法论。内容...

2024-05-28 talkingdev

构建一个RAG系统需要了解检索部分的工作效果。这个工具包提供了多种强大的信息检索性能测量方法，帮助开发者深入分析和优化检索系统的性能。无论是精确度、召回率还是F1分数，这个工具包都能为您提供详尽的数据支持...

2024-05-28 talkingdev

sig是一个在GitHub上开源的工具，它为用户带来了革命性的交互式搜索体验。专注于实时数据流的处理，sig允许用户通过交互方式搜索流经的数据，并且能够即时更新搜索结果。这一特性极大地提高了数据检索的效率和准确性...

2024-05-24 talkingdev

研究人员开发了一种新的方法——全局-局部语义一致学习（Global-Local Semantic Consistent Learning，简称GLSCL），以提升文本视频检索的效率。这一创新方法不仅提高了检索的准确性，还显著降低了计算成本。GLSCL通过...

2024-05-02 talkingdev

本次调查报告深入探讨了检索增强语言模型（RALMs）的领域，重点展示了它们的演变过程、结构以及在NLP任务中的多样化应用，如翻译和对话系统。检索增强语言模型是一种新型的语言模型，不仅通过训练数据生成文本，还能...

2024-05-01 talkingdev

Seismic是一种创新的组织倒排索引的方法，它通过学习稀疏嵌入大大提高了文本检索的速度和准确性。倒排索引是一种常用的信息检索技术，其基本原理是通过构建单词到文档的映射，从而快速找到包含特定单词的文档。而Sei...

2024-04-30 talkingdev

近日，GitHub上出现了一个名为Memary的新项目。该项目允许Agent在知识图谱中存储大量信息，通过我们的记忆模块推断用户知识，只检索与结果相关的信息。Memary的核心是其强大的知识图谱，这是一种可以存储和组织大量...