pg_embedding是一个在GitHub上的开源项目,它使PostgreSQL能够使用分层可浏览小世界(HNSW)算法进行向量相似度搜索。这是目前最先进的十亿规模最近邻搜索系统的实现。HNSW是一种用于索引多维数据的基于图的方法,以...
Read More我们之前在新闻通讯中提到过这个项目,但它刚刚进行了升级。受到Andrej的优秀NanoGPT项目的启发,NanoT5项目可以以比T5论文性能更快150倍的速度训练模型。如果你关心从头开始训练模型,那么这个项目绝对值得一看。
Read MoreExLlama是HF Transformers实现的一种内存更高效的量化权重重写。这个重写的目的是为了在使用量化权重时能够更好地节省内存。Llama是HF Transformers的一个开源项目,但在使用量化权重时存在内存占用较高的问题。ExLl...
Read More近日,OpenAI开源了一份老但经典的论文——Hindsight Experience Replay,该论文是OpenAI成立初期所撰写的。Hindsight Experience Replay是一种处理强化学习中非每个时间步都有奖励的方法,它将代理的经验保存在重放缓...
Read MoreEasy OCR是一个强大的OCR技术开源库,能够从图像或PDF中提取文本。它已经支持了超过80种语言,并采用了一些最先进的方法。 ## Easy OCR的三大核心优势 - 支持超过80种语言,适用于全球各地的使用者。 - 采用最先进...
Read More## 概述 LocalAI 是一个自主托管的开源 API 项目,旨在为 OpenAI 提供本地化的支持。作为一个社区驱动的项目,它可以使用户通过部署本地 API 来访问 OpenAI 的功能。 ## 核心内容 - LocalAI 是一个自主托管的开源...
Read More近日,一款名为 Aviary 的应用在开源代码托管平台 GitHub 上正式发布。这款应用能够让用户在一个平台上与各种大型语言模型互动,具有以下特点: - 在一个平台上与多个语言模型互动,无需频繁切换; - 直接比较不...
Read More近日,一款名为“思维之树”(Tree of Thoughts,简称ToT)的全新算法在GitHub上开源。这款算法不仅具备强大的灵活性,还将模型推理能力提高了70%。 以下是本次报道的核心内容: - “思维之树”是一款全新的算法。 -...
Read More在人工智能领域中,研究人员一直在探索如何利用计算机生成逼真的图像。在这个过程中,DreamBooth 系列研究的下一个步骤——StyleDrop 已经发布。这个开源项目提供了一种新的方法,只需要使用单个参考图像,就可以在任...
Read More最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...
Read More