上下文窗口的相关内容 - 漫话开发者

2025-12-22 talkingdev

AI智能体记忆瓶颈破局：评估上下文压缩策略，结构化摘要表现优异

当AI智能体协助用户处理横跨数百条消息的复杂任务时，一旦其上下文窗口耗尽，是能够继续高效工作，还是被迫从头开始？这直接决定了智能体的实用性与可靠性。Factory.ai的最新研究深入探讨了这一问题，并提出了一套评...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-11-25 talkingdev

人工智能公司Anthropic近期在Claude开发者平台推出三项突破性测试功能，显著提升了AI代理的工具使用能力。工具搜索工具允许Claude动态发现并加载相关工具，避免了预先加载大量工具定义对上下文窗口的占用，同时通过...

2025-11-21 talkingdev

模型上下文协议（MCP）框架迎来重大技术突破，通过代码执行环境实现了AI代理效率的跨越式提升。传统方案需要预加载数百个工具定义并通过上下文窗口传递中间结果，导致计算资源浪费和成本攀升。新技术允许AI代理将MCP...

2025-11-20 talkingdev

OpenAI最新推出的GPT-5.1-Codex-Max标志着智能编程助手领域的重大突破。该模型基于升级的推理架构构建，专门针对长期、复杂的软件工程任务进行优化。其核心创新在于支持跨多上下文窗口的持续操作，使开发者能够执行...

2025-10-01 talkingdev

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战，提出通过系统指令、工具配置、数据筛选和对话历史的精准协同，实现推理效果...

2025-10-01 talkingdev

智谱AI正式推出新一代开源权重模型GLM-4.6，该模型最突出的特性是支持高达200K tokens的上下文窗口，使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

2025-09-20 talkingdev

埃隆·马斯克旗下人工智能公司xAI正式推出新一代多模态模型Grok 4 Fast，该模型突破性地实现了200万token的上下文窗口容量，成为当前业界最大上下文处理能力的模型之一。其革命性在于采用统一架构同时整合了推理模式...