LLM的相关内容 - 漫话开发者

2023-11-23 talkingdev

谷歌推迟Gemini的发布

谷歌推迟了其大型语言模型（LLM）和GPT-4竞争对手Gemini的发布时间，直到2024年第一季度，原因是担心其无法达到或超越OpenAI的GPT-4，并且着重于在允许外部开发人员访问之前加强其消费者产品。

2023-11-23 talkingdev

微软宣布了Windows AI Studio，这是一个供开发人员访问和配置AI模型的中心，提供了来自Azure AI Studio和Hugging Face的工具以及模型配置界面和性能测试模板等功能。英伟达更新了其TensorRT-LLM，支持GeForce RTX 30...

2023-11-20 talkingdev

使用语言模型构建工具是一种新兴的工程学科，涵盖了高性能计算、GPU编排和监控。在这个领域，LLMs（语言模型）是至关重要的组件，它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

2023-11-20 talkingdev

大多数公司仍在思考如何为 AI 和 LLM 工具计费。是套餐？积分？代币？无论您选择哪种模型，Orb 都能使其实现起来非常容易。只需选择您的定价模型和计费指标即可！跟踪消费、防止欺诈，并将定价与价值（包括 GPU 运行...

2023-11-17 talkingdev

LLM Sherpa（GitHub Repo）提供了一组战略API，使得大型语言模型应用能够更加高效地运行。这些API提供了强大的功能，可以大大加速自然语言处理、机器翻译和对话系统等应用。LLM Sherpa也提供了一些基于Python的示例...

2023-11-17 talkingdev

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号，这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

2023-11-16 talkingdev

红木研究的一项研究表明，大型语言模型(LLMs)可以掌握“编码推理”，这是一种隐写术，允许LLMs在生成的文本中嵌入中间推理步骤，使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

2023-11-16 talkingdev

AMBER是一个新的基准，旨在评估和降低多模式大型语言模型（MLLM）中的幻觉，而不依赖其他高级语言模型。该项目已经发布开源库，旨在帮助研究者和开发人员更好地理解和应对多模式语言模型的幻觉问题。