漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
2025-12-05 talkingdev

开源|Walrus:Rust语言打造的高性能Kafka替代方案,基于Raft共识保障容错与负载均衡

近日,一个名为Walrus的开源分布式消息流引擎在GitHub上引发关注。该项目完全使用Rust语言编写,旨在为业界提供一种高性能的Kafka替代方案。其核心架构采用了基于分段的切片技术,并结合Raft共识算法,从而在分布式...

Read More
2025-12-01 talkingdev

技术解析:Prompt缓存如何工作?深度剖析vLLM的Paged Attention与自动前缀缓存机制

在大型语言模型推理优化领域,Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理,特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...

Read More
2025-10-30 talkingdev

分布式SQL数据库白皮书:构建云原生与GenAI时代的数据基石

随着企业数字化转型加速,云原生架构和生成式AI技术正重塑数据基础设施格局。《分布式SQL数据库入门指南》第二版深入剖析了分布式SQL如何通过新型架构满足现代应用需求。该技术通过分布式事务处理、多副本一致性协议...

Read More
2025-10-17 talkingdev

Cloudflare推出边缘网络沙盒SDK,安全执行代码环境

Cloudflare近日正式发布Sandbox SDK,该技术允许开发者在全球边缘网络中安全运行沙盒化代码环境。作为边缘计算领域的重要突破,该SDK通过基于WebAssembly的隔离技术实现代码执行环境的安全隔离,有效防止潜在恶意代...

Read More
2025-09-16 talkingdev

PyTorch与vLLM联手实现分解式推理,大幅提升大语言模型生产环境性能

Meta公司内部团队与vLLM、PyTorch展开深度技术合作,成功推出预填充/解码分离技术(prefill/decode disaggregation),这项突破性技术显著提升了大规模语言模型在生产环境中的推理性能。通过将推理过程分解为预填充...

Read More
2025-09-12 talkingdev

开源|Jetzig:基于Zig语言的高性能Web框架正式发布

近日,开源社区迎来一款基于Zig语言构建的新型Web框架Jetzig,其凭借独特的架构设计和性能优势引发开发者关注。该框架采用文件式路由设计,内置Zmpl模板引擎实现动态HTML渲染,并默认支持RESTful API的JSON数据返回...

Read More
2025-09-06 talkingdev

TikTok欧洲月活突破2亿,青少年用户增长迅猛

短视频平台TikTok近日宣布其在欧洲市场的月活跃用户(MAU)已突破2亿大关,较2024年的1.75亿实现显著增长,相当于欧洲大陆约三分之一人口。这一数据凸显了TikTok在青少年群体中的持续渗透力,也反映了短视频内容生态...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page