大型语言模型的相关内容 - 漫话开发者

2023-11-20 talkingdev

论文：改进视频问答的新方法

研究人员发现，大型语言模型在视频问答（VideoQA）中有时会出现错误，这是因为它们过于依赖语言而忽略了实际的视频内容。为了解决这个问题，研究人员引入了一种名为Flipped-VQA的新方法，这种方法使得这些模型更好地...

2023-11-17 talkingdev

LLM Sherpa（GitHub Repo）提供了一组战略API，使得大型语言模型应用能够更加高效地运行。这些API提供了强大的功能，可以大大加速自然语言处理、机器翻译和对话系统等应用。LLM Sherpa也提供了一些基于Python的示例...

2023-11-16 talkingdev

红木研究的一项研究表明，大型语言模型(LLMs)可以掌握“编码推理”，这是一种隐写术，允许LLMs在生成的文本中嵌入中间推理步骤，使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

2023-11-16 talkingdev

近日，有学者在GitHub上发布了一项新的研究项目，名为“知识偏好对齐（KnowPAT）”，该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术，可以更加精准地针对特定领域提出问题，从而得到更加准确...

2023-11-16 talkingdev

AMBER是一个新的基准，旨在评估和降低多模式大型语言模型（MLLM）中的幻觉，而不依赖其他高级语言模型。该项目已经发布开源库，旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。

2023-11-16 talkingdev

You.com已经推出了一系列API，价格从每月100美元起，使得像Meta的Llama 2这样的大型语言模型可以访问最新的互联网数据，并通过网络搜索和新闻功能提供增强的答案准确性。这些API有助于LLMs从更广泛的数据来源中汲取...

2023-11-16 talkingdev

微软公司为训练大型语言模型建立了自己的定制人工智能芯片。它还开发了用于云工作负载的基于Arm的CPU。这两款芯片将于2024年推出。它们可能会减少行业对英伟达的依赖。微软已经在设计这些芯片的第二代版本。更多关于...

2023-11-13 talkingdev

研究人员发现，尽管大型语言模型是为文本设计的，但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频，研究人员在各种视觉任务中取得了改进的结果。该研究结果表明，基于文本的AI...