大型语言模型的相关内容 - 漫话开发者

2025-03-28 talkingdev

揭秘大型语言模型的思维轨迹

随着人工智能技术的飞速发展，大型语言模型（LLM）的复杂性和能力不断提升，但其内部决策过程仍被视为“黑箱”。近日，研究人员通过先进的追踪技术，成功揭示了LLM在生成文本时的思维路径。这一突破不仅有助于提升模型...

2025-03-27 talkingdev

Model Context Protocol（MCP）是一种为大型语言模型提供工具和上下文的方式。它是一个开放协议，提供标准化的方法来连接AI模型与不同的数据源和工具。现在，OpenAI的Agents SDK已经支持MCP，这使得开发者可以使用广...

2025-03-26 talkingdev

Midjourney近期发布了一项重要工作，旨在提升创意写作模型的多样性表现。该团队通过对一个较小的7B模型进行后训练，使其在创意写作任务中的表现超越了更大规模的开放和封闭模型。这一突破不仅展示了模型优化技术的潜...

2025-03-20 talkingdev

微软研究院最近推出了一项名为KBLAM的创新技术，旨在为大型语言模型（LLMs）引入即插即用的外部知识。这项技术的主要亮点在于，它无需重新训练模型即可实现知识的无缝集成，从而支持在线和实时学习。KBLAM的核心优势...

2025-03-20 talkingdev

Zoom正通过开发一套自主AI基础设施，将其业务从视频会议扩展到行动导向的工作流程。这一创新包括AI Companion 2.0，它提供了任务管理和文档创建等功能，以及通过新的AI Studio定制的AI代理。Zoom采用联合方法，将公...

2025-03-18 talkingdev

Funsearch是一种基于大型语言模型（LLM）驱动的遗传算法新实现，旨在帮助数学家解决组合和数论问题，而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力，为数学研究提供了全新...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-17 talkingdev

HiRAG（Hierarchical Retrieval-Augmented Generation）是一种创新的分层知识增强生成方法，旨在提升检索增强生成（RAG）技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型（LLM）...