tinyvector是一个小巧而快速的向量嵌入数据库。它非常易于定制,并且在小到中等规模的数据集上具有与先进的向量数据库相当的速度。tinyvector可以轻松扩展到超过1亿个向量维度而不会出现问题。
Read Moreembedchain是一个用于创建基于大型语言模型的聊天机器人的框架。它抽象了加载数据集、分块、创建嵌入和存储到向量数据库的整个过程。用户可以通过链接到媒体文件,如视频、PDF、博客文章或网站,创建聊天机器人。这...
Read More本文讨论了几种加速大型语言模型(LLM)训练和推理的技术,以使用高达100K个输入令牌的大上下文窗口。这些技术包括:ALiBi位置嵌入,稀疏注意力,闪电注意力,多查询注意力,条件计算以及使用80GB的A100 GPU。
Read More近日,开发者们在GitHub上发布了一个名为localGPT的Repo,该项目利用Vicuna-7B模型和InstructorEmbeddings实现了离线文档问答功能。以下是该项目的主要亮点: - 使用Vicuna-7B模型:该模型是由EleutherAI开发的巨型...
Read More近日,GitHub上推出了名为RECURRENTGPT的新技术,它是一种基于语言的循环机制,被嵌入到像ChatGPT这样的大型语言模型中。通过模拟长短期记忆机制,RECURRENTGPT实现了任意长度的文本生成,同时保留了长期记忆。该技...
Read MorePinecone是向量数据库的首选之一,可用于需要语言模型与外部数据交互的场景。将数据嵌入向量,并将其存储在数据库中,可解决上下文长度问题,从而扩展语言模型的长期记忆。该公司最近完成了1亿美元的B轮融资,以下是...
Read MorePoseVocab是一种新颖的姿势编码方法,用于人形化建模,它构建了关键姿势和潜在嵌入,有效地编码了动态人类外观,并通过使用特征线、紧凑的3D表示和分层查询策略插值姿势嵌入,实现了姿势泛化和时间一致性。该方法在...
Read More微软推出了一款名为Semantic Kernel (SK) 的轻量级SDK,可将人工智能大型语言模型(LLMs)与传统编程语言集成。这款创新型模型将自然语言语义功能、本地代码功能和基于嵌入式内存的功能融合在一起,以增强应用程序的...
Read More