开源|Gemma Gem：首个完全在设备端通过WebGPU运行谷歌Gemma 4模型的浏览器扩展

talkingdev • 2026-04-06

140392 views

近日，GitHub上出现了一个名为Gemma Gem的开源项目，它是一个Chrome浏览器扩展，能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于，它通过新兴的WebGPU API来实现高性能的本地推理，无需依赖任何API密钥、云端服务或外部服务器。这意味着用户的所有查询和数据都完全保留在个人设备上，从根本上解决了隐私和数据安全问题。这一技术路径代表了AI应用部署的一个重要前沿趋势：将强大的模型能力从云端下沉到边缘设备。WebGPU作为下一代图形和计算API，为浏览器环境带来了接近原生应用的GPU计算能力，使得在浏览器中运行参数规模达数十亿的模型成为可能。Gemma Gem的出现，不仅为开发者提供了一个研究本地化AI部署的绝佳范例，也可能预示着未来AI助手应用将更加注重隐私保护、低延迟和离线可用性，对消费级AI硬件和软件生态的发展具有重要参考价值。

核心要点

Gemma Gem是一个开源Chrome扩展，可在用户设备上本地运行谷歌Gemma 4大模型，无需连接云端。
核心技术是利用WebGPU API进行高性能计算，实现了完全离线的AI推理，保障了用户数据的绝对隐私与安全。
该项目代表了AI模型部署从云端向边缘设备转移的前沿趋势，展示了浏览器内运行复杂模型的可行性。

开源|Gemma Gem：首个完全在设备端通过WebGPU运行谷歌Gemma 4模型的浏览器扩展

核心要点

Related posts