大型语言模型的相关内容 - 漫话开发者

2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ，一种新型量化算法，通过使用4位权重、8位激活和4位KV缓存，加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术，它能够减少模型的存储需求和计算复杂性。在这种情况下，QoQ算法采用了较低精度的数...

2024-05-08 talkingdev

传统上，搜索和推荐一直被分开，因为虽然它们在概念上占据了同一光谱的两端，但它们具有不同的工具、架构和机器学习目标。大型语言模型引入了需要小心管理的期望，因为在开放式解决方案空间中引导客户意图是很困难的...

2024-05-03 talkingdev

近日，GitHub Repo发布了一款名为InstructDr的模型，该模型的设计目标是在各种视觉文档理解任务中表现优异，如问题回答和信息提取等。InstructDr能结合文档图片和大型语言模型，适应新的任务和数据集，其性能超过了...

2024-05-01 talkingdev

正在从加密转向AI的Cognition Labs，正寻求20亿美元的估值为其AI编码工具Devin融资。在AI初创公司估值飙升的趋势中，Cognition的成功反映了行业的增长以及在数据和计算资源上进行重大投资的重要性。像Google和Micros...

2024-05-01 talkingdev

QUICK是一套新的优化CUDA内核，通过解决内存问题，提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升，使AI模型运行更快，效率更高。QUICK的出现，无疑为AI领域带来了新的可能性，通过优化内存处理方式...

2024-04-28 talkingdev

2024年3月的最后一周，开源大型语言模型（LLMs）迎来了一次重要的时刻。包括Databricks的DBRX，A21 Labs的Jamba和SambaNova Systems的Samba-CoE在内的多款模型相继发布。这些发布标志着开源AI模型多样化和普及化的关...

2024-04-28 talkingdev

llamafile项目已经成为Mozilla在GitHub上最受欢迎的项目之一，它为用户提供了一种简单快速的方式，在消费级硬件上运行各种开放的大型语言模型。本文将详细介绍项目的开发过程，以及自v0.1版本以来实施的各种变化。最...

2024-04-16 talkingdev

人工智能(AI)的差异化挑战日益凸显。然而，真正的关键在于不是使用像大型语言模型(LLMs)这样的AI模型，因为这些模型正在变得商品化，而是在于输入这些模型的独特数据。有效的数据工程至关重要，因为它直接影响AI的表...