漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-16 talkingdev

为什么“基于数据的聊天”比你想象的更难

构建特定领域、基于聊天的LLM应用和协同工具比人们想象的更具挑战性。其中一些挑战包括实现强大的性能、处理复杂的数据和复杂的查询,以及为基于LLM的聊天应用程序实现强大的数据检索

Read More
2024-02-16 talkingdev

LWM-视频语言模型可回答长达小时的视频问题

近期,一种新型的视频语言模型已经问世,可以回答长达数百万词的视频问题。该模型采用环形关注机制和精细调整的7B参数模型,能够在检索基准测试中表现极其准确,胜过商业化视频语言模型。

Read More
2024-02-13 talkingdev

Llmware:统一LLM应用程序开发框架

Llmware是一个统一的框架,用于开发基于LLM的应用程序模式,包括检索增强生成。它提供了一个通用的API,使得开发人员能够轻松地使用不同的LLM模型和数据集。Llmware还为开发人员提供了一组可自定义的工具,用于自动...

Read More
2024-02-05 talkingdev

GPTNewspaper开源:6个代理协同工作,打造一份自动化报纸

近日,一款名为GPTNewspaper的开源项目在GitHub上发布。该项目利用了自然语言处理技术,通过6个代理协同工作,实现了报纸的自动化生成。这6个代理分别是:检索代理、摘要代理、文章代理、编辑代理、格式代理和排版代...

Read More
2024-02-05 talkingdev

开源嵌入模型的新阶段

BGE-M3项目介绍了一种多功能的嵌入模型,其在多功能性(密集、多向量和稀疏检索)、多语言性(支持100多种语言)和多粒度性(处理从短句子到长达8192个标记的文档输入)方面表现优异。它使用混合检索管道,结合不同...

Read More
2024-01-30 talkingdev

RAG:探索ColBERT和RAGatouille

ColBERT是一个出色的模型,用于为RAG应用嵌入查询和索引数据。本文探讨了该方法背后的直觉,并进行了一些基准测试。ColBERT的特点在于,它将查询和文档嵌入到一个共享空间中,从而可以直接在该空间中进行相似性匹配...

Read More
2024-01-25 talkingdev

Nano ColBERT:最新开源检索嵌入模型

ColBERT是用于检索的较好的嵌入模型之一。由于许多人正在构建启用RAG的人工智能应用程序,因此值得探索和使用。这个实现是一个简单和直接的复制,没有性能优化和它们所增加的复杂性。它使用HuggingFace的BERT,但实...

Read More
2024-01-24 talkingdev

MM-Interleaved模型开源,可实现图文数据生成

近日,GitHub开源了MM-Interleaved模型,该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像,同时也可以从图像中提取文本。该模型使用了条件生成对抗网络(Co...

Read More
2024-01-20 talkingdev

论文:向量检索基础知识

该份文档详细介绍了向量检索领域的最新状态,涵盖了所需的各个方面知识点。由于其价值,需要花费一定时间来深入研读。向量检索是一种新型的信息检索技术,它是计算机科学和信息检索领域的前沿技术之一,已经成为各种...

Read More
2024-01-15 talkingdev

斯坦福Monarch-32k检索模型发布,比闭源嵌入式模型表现更佳

Together Compute一直在探索不同的Transformer替代方案。最近,他们发布了一款检索模型,该模型的表现优于许多闭源嵌入式模型,适用于检索任务。该模型命名为Monarch Mixer 32k。它是一个基于深度神经网络的模型,可...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page