GGML以纯C语言编写的框架,让用户可以在MacBook电脑上轻松运行大型语言模型,这种模型通常在本地运行成本较高。目前,这一框架主要被业余爱好者使用,但在企业模型部署方面也有广泛的应用前景。 核心要点: - GGML...
Read More研究团队提出了InstructZero,一种新的方法,可以使大型语言模型(LLMs)更好地遵循指令,即使您无法直接调整它们(即“黑盒”模型)。该方法使用“软提示”进行优化,以创建更好的指令。我们的测试表明,在不同任务和各...
Read More近日,一款名为 Aviary 的应用在开源代码托管平台 GitHub 上正式发布。这款应用能够让用户在一个平台上与各种大型语言模型互动,具有以下特点: - 在一个平台上与多个语言模型互动,无需频繁切换; - 直接比较不...
Read More最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...
Read MoreLangchain课程是一个旨在帮助您快速上手使用Langchain的强大开源框架开发应用程序的课程,该框架可以使用大型语言模型(LLMs)如ChatGPT。 ## 核心要点 以下是该新闻的三个核心要点: - Langchain课程现已在GitHu...
Read MoreGorilla模型是基于大型语言模型(LLMs)的一种精细模型,显著优于现有模型如GPT-4在编写API调用方面的表现。它帮助语言模型更有效地使用工具。结合文档检索器,Gorilla可以很好地适应更新的文档,最小化不准确的生成...
Read More内容概要: - 由于AI技术中的“幻觉”问题,MIT研究人员提出了一种新颖的“智能体社会”方法,用于解决像OpenAI的GPT-4这样的大型语言模型生成虚假或不准确信息的问题。 - 该方法涉及使用多个聊天机器人为同一问题提供...
Read MoreNvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...
Read More