漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-01 talkingdev

Anthropic提出AI代理上下文工程新范式:突破有限上下文窗口的智能管理策略

人工智能安全研究公司Anthropic最新发布了关于AI代理上下文工程的技术实践报告。该研究聚焦于在有限上下文窗口内优化令牌分配的核心挑战,提出通过系统指令、工具配置、数据筛选和对话历史的精准协同,实现推理效果...

Read More
2025-10-01 talkingdev

智谱AI发布GLM-4.6大模型:200K上下文窗口,宣称编程推理能力逼近Claude Sonnet 4

智谱AI正式推出新一代开源权重模型GLM-4.6,该模型最突出的特性是支持高达200K tokens的上下文窗口,使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

Read More
2025-08-27 talkingdev

上下文窗口难题:突破Token限制,扩展AI代理能力

当前大型语言模型(LLM)的上下文窗口容量(约100万token)已无法满足企业级代码库的处理需求,这暴露出AI编程工具在复杂场景下的架构瓶颈。为解决这一问题,行业正推动“上下文堆栈”架构的演进,该架构整合了仓库概...

Read More
2024-04-11 talkingdev

Ada-LEval:全新基准测试,挑战理解长文本的能力

近期,Ada-LEval这一新基准测试的发布,旨在严格评估大型语言模型处理长篇及超长文本的理解能力。随着人工智能技术的不断进步,语言模型在处理文本信息方面的能力也越来越受到关注。Ada-LEval的推出,不仅为研究人员...

Read More