语言模型的相关内容 - 漫话开发者

2025-03-20 talkingdev

微软推出KBLAM：为LLM引入即插即用的外部知识

微软研究院最近推出了一项名为KBLAM的创新技术，旨在为大型语言模型（LLMs）引入即插即用的外部知识。这项技术的主要亮点在于，它无需重新训练模型即可实现知识的无缝集成，从而支持在线和实时学习。KBLAM的核心优势...

2025-03-20 talkingdev

Zoom正通过开发一套自主AI基础设施，将其业务从视频会议扩展到行动导向的工作流程。这一创新包括AI Companion 2.0，它提供了任务管理和文档创建等功能，以及通过新的AI Studio定制的AI代理。Zoom采用联合方法，将公...

2025-03-19 talkingdev

MaTVLM是一个创新的混合视觉语言模型，通过将Mamba-2层集成到预训练的视觉语言模型（VLM）中，显著提升了其收敛速度与整体性能。这一技术突破不仅在学术界引起了广泛关注，也为工业界的应用带来了新的可能性。视觉语...

2025-03-18 talkingdev

MMS-LLaMA是一款高效的多模态语音大语言模型框架，专注于自动视觉语音识别（AVSR），在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据，提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...

2025-03-18 talkingdev

Funsearch是一种基于大型语言模型（LLM）驱动的遗传算法新实现，旨在帮助数学家解决组合和数论问题，而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力，为数学研究提供了全新...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-17 talkingdev

HiRAG（Hierarchical Retrieval-Augmented Generation）是一种创新的分层知识增强生成方法，旨在提升检索增强生成（RAG）技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型（LLM）...

2025-03-17 talkingdev

近日，GitHub上发布了一个名为'Visual reasoning models'的开源工具包，旨在训练视觉语言模型（VLMs）以提升其基础逻辑和推理能力。该工具包由groundlight团队开发，主要专注于增强模型在处理复杂视觉数据时的理解和...