近期,一项关于大语言模型(LLMs)的研究揭示了其在处理复杂提示时是否具备多跳推理能力——即连接多个知识片段的推理过程。研究发现,这种潜在的推理过程确实存在,尤其在初始步骤中表现明显。然而,模型对连接知识的...
Read MoreMeta 最近引入了一种新的基准测试,用于评估语言模型的推理能力和知识水平。该测试向语言模型提供一个长序列数据,并要求模型输出能够重新生成该序列并停止运行的最短程序。这一过程被称为 Kolmogorov 压缩,且在多...
Read More微软研究院最近推出了一项名为KBLAM的创新技术,旨在为大型语言模型(LLMs)引入即插即用的外部知识。这项技术的主要亮点在于,它无需重新训练模型即可实现知识的无缝集成,从而支持在线和实时学习。KBLAM的核心优势...
Read MoreZoom正通过开发一套自主AI基础设施,将其业务从视频会议扩展到行动导向的工作流程。这一创新包括AI Companion 2.0,它提供了任务管理和文档创建等功能,以及通过新的AI Studio定制的AI代理。Zoom采用联合方法,将公...
Read MoreMaTVLM是一个创新的混合视觉语言模型,通过将Mamba-2层集成到预训练的视觉语言模型(VLM)中,显著提升了其收敛速度与整体性能。这一技术突破不仅在学术界引起了广泛关注,也为工业界的应用带来了新的可能性。视觉语...
Read MoreMMS-LLaMA是一款高效的多模态语音大语言模型框架,专注于自动视觉语音识别(AVSR),在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据,提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...
Read MoreFunsearch是一种基于大型语言模型(LLM)驱动的遗传算法新实现,旨在帮助数学家解决组合和数论问题,而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力,为数学研究提供了全新...
Read More近期,OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术,利用大型语言模型(LLM)作为“教师”来训练更小的系统,从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中,...
Read More