长上下文的相关内容 - 漫话开发者

2026-02-20 talkingdev

开源|StepFun发布前沿开源模型Step 3.5 Flash：高效推理与智能体能力新标杆

近日，StepFun正式发布了其前沿开源基础模型Step 3.5 Flash。该模型定位为高效、高速推理与具备智能体（Agent）能力的先进模型，其核心特性在于集成了工具使用、长上下文处理以及支持本地部署等关键能力。Step 3.5 F...

2026-01-31 talkingdev

开源|月之暗面发布最强模型Kimi K2.5技术报告，引发开发者社区热议

近日，国内人工智能公司月之暗面（Moonshot AI）在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开，迅速吸引了全球开发者与AI研究者的高度关注，在知名技术社区Hacker News上获得...

2026-01-27 talkingdev

开源|SWE-Pruner：代码智能体上下文剪枝框架，令牌消耗锐减超50%

近日，GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架，旨在显著优化代码智能体（Coding Agents）在处理复杂软件工程任务时的效率与成本。该框架的核心在于，通过一个轻量级模型动态分析与...

2026-01-05 talkingdev

开源|HGMem：超图工作记忆框架提升LLM复杂关系推理能力

近日，一个名为HGMem的开源项目在GitHub上发布，该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

2026-01-01 talkingdev

开源|E2E：基于JAX的端到端测试时训练框架，革新长上下文语言建模

近日，GitHub上开源了一个名为E2E的JAX官方实现项目，它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构，并配合滑动窗口注...

2026-01-01 talkingdev

开源|LMCache：为LLM服务注入极速KV缓存层，响应速度提升3-10倍

近日，一个名为LMCache的开源项目在GitHub上发布，旨在通过创新的键值（KV）缓存加速层，显著提升大型语言模型（LLM）的服务性能。该项目专为LLM推理服务设计，其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

2025-12-17 talkingdev

开源|通义千问推出Qwen-Doc项目，专注长文档理解与智能解析

阿里云通义千问团队近日在GitHub上开源了Qwen-Doc项目，这是一个专注于文档人工智能（Document AI）的开源计划。该项目旨在通过提供先进的模型和工具集，显著提升AI系统对长上下文文档的理解、解析能力，并支持基于...

2025-12-12 talkingdev

OpenAI发布GPT-5.2：专为专业工作与长期智能体设计的顶尖前沿模型

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2，该模型被定位为专为专业知识工作和长期运行的智能体（agents）而设计的最先进系统。根据官方介绍，GPT-5.2在多个关键领域树立了新的性能标杆，包括代码生...