近日,GitHub上出现了一个名为Gemma Gem的开源项目,它是一个Chrome浏览器扩展,能够将谷歌最新发布的Gemma 4大型语言模型完全在用户本地设备上运行。该项目最大的技术亮点在于,它通过新兴的WebGPU API来实现高性能...
Read More谷歌DeepMind近日正式发布了Gemma 4系列开源模型,标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建,核心优化方向是“单位参数智能效率”,即在保持模型参数规模相对可控的同时,...
Read More谷歌DeepMind正式推出了新一代开源模型系列Gemma 4,该系列模型基于其旗舰模型Gemini 3的研究成果构建,被官方称为“迄今为止最智能的开源模型”。Gemma 4的核心优化方向聚焦于复杂的推理能力和智能体(Agent)工作流...
Read More谷歌研究团队近日推出了全新大语言模型VaultGemma,这是全球首个基于严格差分隐私(Differential Privacy)技术从头训练的大型语言模型。该模型通过数学层面可验证的隐私保护机制,在训练过程中注入经过精确校准的噪...
Read More谷歌研究团队正式推出VaultGemma模型,这是目前全球最大的基于差分隐私技术从头训练的开源大语言模型,参数量达到10亿级别。该模型已在Hugging Face和Kaggle平台开放访问。VaultGemma采用严格的差分隐私训练框架,在...
Read MoreGoogle最新发布的Gemma 3n和MatFormer模型采用了创新的嵌套Transformer架构,通过Mix-n-Match技术实现弹性推理功能。该技术允许模型在运行时动态调整计算资源分配,显著提升推理效率并降低计算成本。本实践教程详细...
Read More艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...
Read More谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行,技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点:1)利用llama.cpp的量化推理优化实现低资...
Read More