长上下文的相关内容 - 漫话开发者

2025-12-12 talkingdev

OpenAI发布GPT-5.2：专为专业工作与长期智能体优化的前沿模型

OpenAI正式推出其新一代前沿模型GPT-5.2，该模型被定位为专为专业工作场景和长期运行的智能体（agent）工作流而优化的最先进模型。相较于前代，GPT-5.2在多个关键维度实现了显著提升：其一，在知识工作领域，模型展...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-12-04 talkingdev

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据，结果显示，相较于前代H100/H200平台，该服务器在运行特定类型的混合专家模型时，性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

2025-11-22 talkingdev

据《华尔街日报》报道，中国人工智能公司月之暗面（Moonshot AI）正启动新一轮数亿美元规模的融资，估值预计达40亿美元。该公司开发的Kimi智能助手凭借超长上下文处理能力成为行业焦点，目前已向潜在投资者透露计划...

2025-10-21 talkingdev

DeepSeek-AI团队最新开源的DeepSeek-OCR项目在长上下文压缩技术领域实现重要突破。该项目通过创新的光学二维映射技术，探索将长文本上下文进行高效压缩的可行性。系统由DeepEncoder核心引擎和DeepSeek3B-Moe-A570M解...

2025-10-17 talkingdev

斯坦福大学研究人员提出的递归语言模型（RLMs）实现了突破性的推理架构创新。该模型通过REPL环境将输入上下文分解为可交互变量，实现了对无限长上下文的递归处理。在OOLONG基准测试中，基于GPT-5-mini构建的RLMs模型...

2025-10-01 talkingdev

智谱AI正式推出新一代开源权重模型GLM-4.6，该模型最突出的特性是支持高达200K tokens的上下文窗口，使其能够处理更长的文档和复杂任务链。官方宣称在编程与逻辑推理任务上已接近Anthropic公司发布的Claude Sonnet 4...

2025-09-30 talkingdev

深度求索公司最新推出的DeepSeek-V3.2-Exp模型引入了创新的稀疏注意力机制，这一技术突破专门针对长上下文序列的训练和推理效率进行了深度优化。该机制通过智能选择关键注意力区域，显著降低了计算复杂度，使得模型...