Gemma的相关内容 - 漫话开发者

2025-04-16 talkingdev

谷歌发布TxGemma开源模型，加速医疗科学中的治疗发现

谷歌近日基于其Gemma模型系列推出了专为医疗科学领域优化的TxGemma开源模型。该模型在治疗方案的发现方面展现出卓越性能，不仅超越了大多数专用模型，还在所有开源通用模型中表现最佳。TxGemma的发布标志着人工智能...

2025-03-25 talkingdev

近日，Unsloth团队宣布已成功解决了来自DeepMind的新开源权重模型——Gemma 3的一些技术难题。通过与Unsloth的工具包集成，开发者现在可以在免费的Google Colab实例上对Gemma 3进行微调训练。这一突破性进展不仅降低了...

2025-03-17 talkingdev

近年来，许多被标榜为“开源”的AI模型实际上附带了限制性许可条款，这对于依赖这些技术的中小企业可能带来不利影响。近期，谷歌新发布的Gemma 3模型以及Meta的类似产品引起了广泛关注，它们的商用限制条款被认为可能...

2025-03-13 talkingdev

谷歌近日发布了Gemma 3模型的权重和技术报告，这一模型共有四种规模，其性能与Gemini 1.5 Pro相当。Gemma 3不仅在多语言处理上表现出色，能够理解超过140种语言，还被认为是接近当前最先进的密集模型之一。这一发布...

2024-07-12 talkingdev

PaliGemma是一款基于SigLIP和Gemma 2B的强大视觉语言模型。这份技术报告详细阐述了在构建PaliGemma过程中的架构选择和数据收集方面所做的决策。SigLIP和Gemma 2B的结合使得PaliGemma在视觉语言建模方面展现出卓越性...

2024-06-28 talkingdev

我们很高兴地宣布，Gemma 2系列的两款新型号——9B和27B现已正式上市。这两款新型号均秉承了Gemma 2系列的一贯优良传统，将先进的技术与优雅的设计完美融合。无论是在性能、可靠性还是易用性方面，Gemma 2的9B和27B都...

2024-06-20 talkingdev

Logit Lens方法已经得到了增强，该方法通过分解logit输出，帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流，注意力层和MLP层，揭示了这些部分如何影响预测，并为gemma-2b模型执行的诸如...

2024-05-20 talkingdev

现在，您可以使用GPT-Fast实时运行最新的Google VLM。这为我们打开了一扇强大的大门，因为该模型非常容易为特定任务进行微调。这意味着，我们可以轻松地将其应用到各种下游任务中。PaliGemma的实时运行不仅能够提高...