长文本理解的相关内容 - 漫话开发者

2026-05-06 talkingdev

12百万token上下文窗口被打破：Subquadratic发布超长上下文AI模型

上下文窗口的大小一直是大型语言模型在处理长文本任务时的关键瓶颈。近日，初创公司Subquadratic宣布推出一款全新的AI模型，其上下文窗口达到了惊人的1200万token（约合1200万个单词或代码标记），远超过当前主流模...

2025-10-01 talkingdev

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战，提出通过系统指令、工具配置、数据筛选和对话历史的精准协同，实现推理效果...

2025-10-01 talkingdev

智谱AI正式推出新一代开源权重模型GLM-4.6，该模型最突出的特性是支持高达200K tokens的上下文窗口，使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

2025-08-27 talkingdev

当前大型语言模型（LLM）的上下文窗口容量（约100万token）已无法满足企业级代码库的处理需求，这暴露出AI编程工具在复杂场景下的架构瓶颈。为解决这一问题，行业正推动“上下文堆栈”架构的演进，该架构整合了仓库概...

2024-04-11 talkingdev

近期，Ada-LEval这一新基准测试的发布，旨在严格评估大型语言模型处理长篇及超长文本的理解能力。随着人工智能技术的不断进步，语言模型在处理文本信息方面的能力也越来越受到关注。Ada-LEval的推出，不仅为研究人员...