大型语言模型的相关内容 - 漫话开发者

2023-11-23 talkingdev

亚马逊据称正在使用两倍于GPT-4的参数进行AI训练

亚马逊正在为进入AI竞赛做准备，推出Olympus，这是一个拥有2万亿参数的大型语言模型，旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表，但它...

2023-11-23 talkingdev

谷歌推迟了其大型语言模型（LLM）和GPT-4竞争对手Gemini的发布时间，直到2024年第一季度，原因是担心其无法达到或超越OpenAI的GPT-4，并且着重于在允许外部开发人员访问之前加强其消费者产品。

2023-11-23 talkingdev

微软宣布了Windows AI Studio，这是一个供开发人员访问和配置AI模型的中心，提供了来自Azure AI Studio和Hugging Face的工具以及模型配置界面和性能测试模板等功能。英伟达更新了其TensorRT-LLM，支持GeForce RTX 30...

2023-11-20 talkingdev

研究人员发现，大型语言模型在视频问答（VideoQA）中有时会出现错误，这是因为它们过于依赖语言而忽略了实际的视频内容。为了解决这个问题，研究人员引入了一种名为Flipped-VQA的新方法，这种方法使得这些模型更好地...

2023-11-17 talkingdev

LLM Sherpa（GitHub Repo）提供了一组战略API，使得大型语言模型应用能够更加高效地运行。这些API提供了强大的功能，可以大大加速自然语言处理、机器翻译和对话系统等应用。LLM Sherpa也提供了一些基于Python的示例...

2023-11-16 talkingdev

红木研究的一项研究表明，大型语言模型(LLMs)可以掌握“编码推理”，这是一种隐写术，允许LLMs在生成的文本中嵌入中间推理步骤，使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

2023-11-16 talkingdev

近日，有学者在GitHub上发布了一项新的研究项目，名为“知识偏好对齐（KnowPAT）”，该项目旨在利用大型语言模型来改进领域特定问答系统。研究人员借助该技术，可以更加精准地针对特定领域提出问题，从而得到更加准确...

2023-11-16 talkingdev

AMBER是一个新的基准，旨在评估和降低多模式大型语言模型（MLLM）中的幻觉，而不依赖其他高级语言模型。该项目已经发布开源库，旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。