检索的相关内容 - 漫话开发者

2024-02-16 talkingdev

为什么“基于数据的聊天”比你想象的更难

构建特定领域、基于聊天的LLM应用和协同工具比人们想象的更具挑战性。其中一些挑战包括实现强大的性能、处理复杂的数据和复杂的查询，以及为基于LLM的聊天应用程序实现强大的数据检索。

2024-02-16 talkingdev

近期，一种新型的视频语言模型已经问世，可以回答长达数百万词的视频问题。该模型采用环形关注机制和精细调整的7B参数模型，能够在检索基准测试中表现极其准确，胜过商业化视频语言模型。

2024-02-13 talkingdev

Llmware是一个统一的框架，用于开发基于LLM的应用程序模式，包括检索增强生成。它提供了一个通用的API，使得开发人员能够轻松地使用不同的LLM模型和数据集。Llmware还为开发人员提供了一组可自定义的工具，用于自动...

2024-02-05 talkingdev

近日，一款名为GPTNewspaper的开源项目在GitHub上发布。该项目利用了自然语言处理技术，通过6个代理协同工作，实现了报纸的自动化生成。这6个代理分别是：检索代理、摘要代理、文章代理、编辑代理、格式代理和排版代...

2024-02-05 talkingdev

BGE-M3项目介绍了一种多功能的嵌入模型，其在多功能性（密集、多向量和稀疏检索）、多语言性（支持100多种语言）和多粒度性（处理从短句子到长达8192个标记的文档输入）方面表现优异。它使用混合检索管道，结合不同...

2024-01-30 talkingdev

ColBERT是一个出色的模型，用于为RAG应用嵌入查询和索引数据。本文探讨了该方法背后的直觉，并进行了一些基准测试。ColBERT的特点在于，它将查询和文档嵌入到一个共享空间中，从而可以直接在该空间中进行相似性匹配...

2024-01-25 talkingdev

ColBERT是用于检索的较好的嵌入模型之一。由于许多人正在构建启用RAG的人工智能应用程序，因此值得探索和使用。这个实现是一个简单和直接的复制，没有性能优化和它们所增加的复杂性。它使用HuggingFace的BERT，但实...

2024-01-24 talkingdev

近日，GitHub开源了MM-Interleaved模型，该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像，同时也可以从图像中提取文本。该模型使用了条件生成对抗网络（Co...

2024-01-20 talkingdev

该份文档详细介绍了向量检索领域的最新状态，涵盖了所需的各个方面知识点。由于其价值，需要花费一定时间来深入研读。向量检索是一种新型的信息检索技术，它是计算机科学和信息检索领域的前沿技术之一，已经成为各种...

2024-01-15 talkingdev

Together Compute一直在探索不同的Transformer替代方案。最近，他们发布了一款检索模型，该模型的表现优于许多闭源嵌入式模型，适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型，可...