上下文窗口的相关内容 - 漫话开发者

2026-06-17 talkingdev

Z.ai 发布 GLM-5.2：百万级Token上下文窗口与长程编码任务支持，专为智能体软件工程打造

Z.ai 最新发布了其AI模型 GLM-5.2，这是一次面向编码领域的重大升级。该模型拥有高达 100 万 token 的超大上下文窗口，能够处理整个代码库的长程编码任务，并引入了新的推理控制机制。GLM-5.2 目前已向 Coding Plan...

2026-06-05 talkingdev

Tether团队近日发布了QVAC SDK的最新版本，这是一款面向本地设备、专注于构建跨平台P2P应用的开源工具包。此次更新的核心亮点在于集成了名为TurboQuant的全新优化技术。通过这一技术，开发者在相同硬件条件下，能够...

2026-06-03 talkingdev

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型，并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口，并且官方承诺API至少保证提供51.2万个token的处...

2026-06-01 talkingdev

MiniMax 最新发布的开源权重模型 M3 在编码和智能体（Agentic）任务上达到前沿水平。该模型不仅支持图像和视频输入，还可以直接操作桌面计算机。技术上，M3 引入了一种新的注意力架构，支持上下文缩放，并能够处理多...

2026-05-06 talkingdev

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日，初创公司Subquadratic宣布推出一款全新的AI模型，其上下文窗口达到了惊人的1200万token（约合1200万个单词或代码标记），远超过当前主流模...

2026-04-23 talkingdev

在大型语言模型领域，一种新的视角正在引发讨论：将上下文视为“软件”，而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文（如KV缓存）动态地调节模型的激活值，为特定任务提供临时性的“编程”，从而实现...

2026-03-25 talkingdev

Anthropic公司旗下的Claude模型近期迎来重大更新，其4.6版本标志着人工智能助手在功能集成与专业化应用方面迈出了关键一步。该版本最显著的技术突破在于其高达100万token的上下文处理能力，这为处理长文档、复杂代码...

2026-03-20 talkingdev

OpenAI的Codex编码代理系统采用了一种名为“代理循环”的核心机制，该机制通过迭代式地构建提示、与底层大模型交互、并执行工具调用（如运行命令或测试）来完成复杂的编程任务。为了应对日益增长的对话历史和多层上下...