漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-17 talkingdev

如何在树莓派上运行LLMs

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号,这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

Read More
2023-11-16 talkingdev

LLM可使用隐写术隐藏推理过程

红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

Read More
2023-11-16 talkingdev

降低多模态语言模型的幻觉: AMBER发布开源库

AMBER是一个新的基准,旨在评估和降低多模式大型语言模型(MLLM)中的幻觉,而不依赖其他高级语言模型。该项目已经发布开源库,旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。

Read More
2023-11-16 talkingdev

LLM Decontaminaor:新型模型欺骗性能的方法

当新的模型拥有惊人的性能时,人们往往会质疑它们是否真的是在验证数据或基准测试上得到了训练。去污是从输入中删除此类测试数据的过程。LMSYS团队发现,如果你重新表述测试数据,使其通过去污,但仍包含关于基准测...

Read More
2023-11-16 talkingdev

You.com推出新API,为LLMs连接互联网提供支持

You.com已经推出了一系列API,价格从每月100美元起,使得像Meta的Llama 2这样的大型语言模型可以访问最新的互联网数据,并通过网络搜索和新闻功能提供增强的答案准确性。这些API有助于LLMs从更广泛的数据来源中汲取...

Read More
2023-11-14 talkingdev

构建和使用基于LLM的应用程序的我的思维模型

本文介绍了LLM的思维模型以及如何克服它们的局限性。了解LLM的思维模型是为了知道它们的适用范围,以及如何更好地使用它们。大多数人已经对谷歌有了类似的模型,但他们并没有意识到这一点——人们默认每个人都知道如何...

Read More
2023-11-14 talkingdev

开源GPTs:GitHub仓库OpenGPTs发布

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs,提示,超过100个工具,向量数据库,检索算法和聊天历史数据库。该项目使用LangChain,LangServe和LangSmith。OpenGPTs的...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
  1. Prev Page
  2. 93
  3. 94
  4. 95
  5. Next Page