近日,一款名为 Aviary 的应用在开源代码托管平台 GitHub 上正式发布。这款应用能够让用户在一个平台上与各种大型语言模型互动,具有以下特点: - 在一个平台上与多个语言模型互动,无需频繁切换; - 直接比较不...
Read More最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...
Read MoreLangchain课程是一个旨在帮助您快速上手使用Langchain的强大开源框架开发应用程序的课程,该框架可以使用大型语言模型(LLMs)如ChatGPT。 ## 核心要点 以下是该新闻的三个核心要点: - Langchain课程现已在GitHu...
Read MoreGorilla模型是基于大型语言模型(LLMs)的一种精细模型,显著优于现有模型如GPT-4在编写API调用方面的表现。它帮助语言模型更有效地使用工具。结合文档检索器,Gorilla可以很好地适应更新的文档,最小化不准确的生成...
Read More内容概要: - 由于AI技术中的“幻觉”问题,MIT研究人员提出了一种新颖的“智能体社会”方法,用于解决像OpenAI的GPT-4这样的大型语言模型生成虚假或不准确信息的问题。 - 该方法涉及使用多个聊天机器人为同一问题提供...
Read MoreNvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...
Read More研究人员基于超过 350 个 STEM(科学、技术、工程和数学)定理,开发了包含 800 个问题-答案对的数据集,用于测试人工智能语言模型。该数据集为衡量人工智能使用这些定理解决复杂的大学级问题的能力提供了新的基准。...
Read More近日,GitHub上推出了名为RECURRENTGPT的新技术,它是一种基于语言的循环机制,被嵌入到像ChatGPT这样的大型语言模型中。通过模拟长短期记忆机制,RECURRENTGPT实现了任意长度的文本生成,同时保留了长期记忆。该技...
Read More