Gorilla模型是基于大型语言模型(LLMs)的一种精细模型,显著优于现有模型如GPT-4在编写API调用方面的表现。它帮助语言模型更有效地使用工具。结合文档检索器,Gorilla可以很好地适应更新的文档,最小化不准确的生成...
Read More内容概要: - 由于AI技术中的“幻觉”问题,MIT研究人员提出了一种新颖的“智能体社会”方法,用于解决像OpenAI的GPT-4这样的大型语言模型生成虚假或不准确信息的问题。 - 该方法涉及使用多个聊天机器人为同一问题提供...
Read MoreNvidia在2023年Computex展示了一项新的生成式AI技术,可以让人们用自己的声音与游戏角色进行对话。Nvidia Avatar Cloud Engine将在本地和云端运行,包括部署大型语言模型、语音转文本、文本转语音等工具。文章中提供...
Read More研究人员基于超过 350 个 STEM(科学、技术、工程和数学)定理,开发了包含 800 个问题-答案对的数据集,用于测试人工智能语言模型。该数据集为衡量人工智能使用这些定理解决复杂的大学级问题的能力提供了新的基准。...
Read More近日,GitHub上推出了名为RECURRENTGPT的新技术,它是一种基于语言的循环机制,被嵌入到像ChatGPT这样的大型语言模型中。通过模拟长短期记忆机制,RECURRENTGPT实现了任意长度的文本生成,同时保留了长期记忆。该技...
Read MoreDB-GPT是一个项目,旨在为所有数据库场景构建完整的私有语言模型解决方案。它旨在确保敏感数据和环境完全受控,以避免大型语言模型造成的数据隐私泄露或安全风险。DB-GPT支持本地部署,以确保模型始终是私有的、安全...
Read MoreSuperAgent是一款强大的工具,可以简化LLM(大型语言模型)代理的配置和部署过程。该工具已在GitHub上发布,可以免费获取。 ### 核心要点: - SuperAgent是一款用于配置和部署LLM代理的工具 - 该工具可以简化代理...
Read More谷歌发布了新版大型语言模型PaLM 2,其训练数据量几乎是其2022年前辈的五倍,使其能够执行更高级的编码、数学和创意写作任务。 ## 核心要点 以下是该新闻的三个核心要点: - Google发布了新版大型语言模型PaLM 2...
Read More