LLM的相关内容 - 漫话开发者

2023-10-23 talkingdev

深度探讨：构建基于LLM的Web应用程序

大多数组织机构没有资源在GPU上运行大型模型，但是有一个强大的开源推动力量在本地运行这些模型。本文探讨了这种推动力量以及LangChain + Ollama集成。 LLN（Local Low Rank Normalization）是一种用于处理基于卷积...

2023-10-20 talkingdev

小型LLMs可能会超越大型LLMs，因为它们具有更快的训练速度、能够在没有专门硬件的情况下本地运行、具有经济性、延迟较低、部署容易、可能具有更好的可解释性和可重现性等优势。

2023-10-20 talkingdev

近年来，大型语言模型(LLMs)在自然语言处理领域引起了广泛关注，但它们如何表达真相仍然是一个有待研究的问题。为了解决这个问题，研究人员开发了一些交互式图表，可以帮助用户更好地理解LLMs如何表示真相。这些图表...

2023-10-20 talkingdev

研究人员推出了FACTCHD，这是一个基准测试，旨在检测像ChatGPT这样的大型语言模型在复杂情况下产生事实错误的信息。

2023-10-20 talkingdev

XAgent是一个开源的实验性LLM驱动的自主代理工具，可以自动解决各种任务。该工具利用深度学习算法，训练出一个自主学习的模型，可以在不同的环境中自动适应并完成任务。XAgent提供了丰富的API接口，可以与其他工具无...

2023-10-19 talkingdev

Adept发布了一个极其简单（没有图像编码器）而且非常高效（超过了13B模型）的多模式模型。这篇文章概述了Adept如何评估模型的性能以及一些模型的细节。

2023-10-18 talkingdev

本研究介绍了LLM4SGG弱监督场景图生成方法，该方法利用大型语言模型的能力，从图像标题中更好地提取和对齐关系，解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

2023-10-18 talkingdev

近日，一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型，以贝多芬和凯撒大帝等历史名人为蓝本，通过为它们提供特定的人物资料，从而模拟这些历史人物的语言风格和思想特征。这一技术的...