LLM的相关内容 - 漫话开发者

2023-08-21 talkingdev

你可能不需要微调大型语言模型

对于大多数大型语言模型（LLM）应用，微调并非必要。使用少量提示或检索增强生成（RAG）可能是更好的选择。少量提示是指向LLM提供期望输出的示例，而RAG则涉及查询向量数据库，获取LLM未经训练的信息。这意味着，我...

2023-08-21 talkingdev

GitHub近期发布了一款名为txtai的全新工具，这是一款集成语义搜索、LLM编排和语言模型工作流的全能型嵌入式数据库。这款工具能够将多种功能与应用集成在一起，为开发者提供了一个全新的、一体化的解决方案。通过txta...

2023-08-18 talkingdev

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具，可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程，通过使用 DeepEval，开发者可以在不连接网络的情况下，对其进行评估和优化...

2023-08-17 talkingdev

出色的研究员Chip Huyen提出了LLM（语言模型）研究中的十大开放性挑战。首先，幻觉和上下文长度问题在当前讨论中频繁出现。然而，最有趣的可能是多模态、架构改进，以及对GPU的替代方案。目前，有许多聪明的研究人员...

2023-08-17 talkingdev

近日，一项研究引入了一种名为Solo Performance Prompting（SPP）的方法。该方法利用LLMs中的多个角色模拟认知协同，这是一种提高问题解决能力的协作过程。通过使用经过精细调整的角色，SPP使LLMs能够处理需要深度领...

2023-08-16 talkingdev

DoctorGPT，这款领先的语言模型（LLM），已经能够通过美国医疗执照考试。它的特点是可以离线工作，跨平台运行，且能保护用户的健康数据私密性。这款开源的AI医生，将为医疗行业带来革命性的改变，使得医疗服务更具普...

2023-08-14 talkingdev

众多模型都基于Llama 2进行构建，并在GPT-4的输出上进行训练。在非商业许可的模型中，Orca和Platypus LLM的结合表现出了强大的能力。这些模型可以说是处于这个范围，但它们已经非常强大。基于Llama 2的模型数量众多...

2023-08-14 talkingdev

近期，ChainML发布了Council——一款开源的AI代理平台，它使得快速开发和部署定制的生成AI应用变得简单。Council可以与多种语言理解模型（LLMs）如GPT-4、Llama 2和Claude 2等进行集成，以实现业务应用的生成AI，从而...