漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-31 talkingdev

使用互惠排名结合混合搜索实现更好的RAG结果

信息检索中,RAG模型是一种常见的评估信息检索系统的方法。近日,研究人员提出了一种新的RAG模型改进方法,即使用互惠排名融合和混合搜索。在实验中,该方法比传统的RAG模型表现更好,大幅提高了搜索结果的质量和...

Read More
2024-05-28 talkingdev

构建RAG信息检索测量的工具包

构建一个RAG系统需要了解检索部分的工作效果。这个工具包提供了多种强大的信息检索性能测量方法,帮助开发者深入分析和优化检索系统的性能。无论是精确度、召回率还是F1分数,这个工具包都能为您提供详尽的数据支持...

Read More
2024-05-01 talkingdev

论文:Seismic使用更快的嵌入搜索进行文本检索

Seismic是一种创新的组织倒排索引的方法,它通过学习稀疏嵌入大大提高了文本检索的速度和准确性。倒排索引是一种常用的信息检索技术,其基本原理是通过构建单词到文档的映射,从而快速找到包含特定单词的文档。而Sei...

Read More
2024-04-30 talkingdev

Memary开源:长记忆Agent开启大规模知识图谱存储新篇章

近日,GitHub上出现了一个名为Memary的新项目。该项目允许Agent在知识图谱中存储大量信息,通过我们的记忆模块推断用户知识,只检索与结果相关的信息。Memary的核心是其强大的知识图谱,这是一种可以存储和组织大量...

Read More
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-12 talkingdev

互联网档案馆图书数据集开放

互联网档案馆拥有超过2亿个OCR图书页面,可供研究使用。该数据集可用于文本识别、自然语言处理、信息检索等多个领域的研究。研究人员可以使用该数据集进行模型训练、语言建模、数据分析等工作。该数据集的发布将加速...

Read More
2024-02-29 talkingdev

论文:ListT5重排方法以提高信息检索的准确性

ListT5推出了一种前沿的重排方法,不仅可以提高信息检索的准确性,还提供了一个高效的解决方案,以应对以前的列表式重排器面临的挑战。

Read More
2024-01-30 talkingdev

RAG:探索ColBERT和RAGatouille

ColBERT是一个出色的模型,用于为RAG应用嵌入查询和索引数据。本文探讨了该方法背后的直觉,并进行了一些基准测试。ColBERT的特点在于,它将查询和文档嵌入到一个共享空间中,从而可以直接在该空间中进行相似性匹配...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page