漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-01 talkingdev

开源|LMCache:为LLM服务注入极速KV缓存层,响应速度提升3-10倍

近日,一个名为LMCache的开源项目在GitHub上发布,旨在通过创新的键值(KV)缓存加速层,显著提升大型语言模型(LLM)的服务性能。该项目专为LLM推理服务设计,其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

Read More
2024-11-25 talkingdev

RFC 35140标准发布:引入HTTP Do-Not-Stab机制

互联网工程任务组(IETF)发布了RFC 35140标准文档,正式引入了名为HTTP Do-Not-Stab的新机制。该机制旨在优化网络缓存性能,通过减少不必要的缓存失效来提升用户体验和网络效率。具体来说,HTTP Do-Not-Stab允许服务...

Read More