Gemma的相关内容 - 漫话开发者

2025-03-13 talkingdev

谷歌发布开源权重模型Gemma 3，性能接近Gemini 1.5 Pro

谷歌近日发布了Gemma 3模型的权重和技术报告，这一模型共有四种规模，其性能与Gemini 1.5 Pro相当。Gemma 3不仅在多语言处理上表现出色，能够理解超过140种语言，还被认为是接近当前最先进的密集模型之一。这一发布...

2024-07-12 talkingdev

PaliGemma是一款基于SigLIP和Gemma 2B的强大视觉语言模型。这份技术报告详细阐述了在构建PaliGemma过程中的架构选择和数据收集方面所做的决策。SigLIP和Gemma 2B的结合使得PaliGemma在视觉语言建模方面展现出卓越性...

2024-06-28 talkingdev

我们很高兴地宣布，Gemma 2系列的两款新型号——9B和27B现已正式上市。这两款新型号均秉承了Gemma 2系列的一贯优良传统，将先进的技术与优雅的设计完美融合。无论是在性能、可靠性还是易用性方面，Gemma 2的9B和27B都...

2024-06-20 talkingdev

Logit Lens方法已经得到了增强，该方法通过分解logit输出，帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流，注意力层和MLP层，揭示了这些部分如何影响预测，并为gemma-2b模型执行的诸如...

2024-05-20 talkingdev

现在，您可以使用GPT-Fast实时运行最新的Google VLM。这为我们打开了一扇强大的大门，因为该模型非常容易为特定任务进行微调。这意味着，我们可以轻松地将其应用到各种下游任务中。PaliGemma的实时运行不仅能够提高...

2024-05-15 talkingdev

Google在今天的发布中公布并展示了一些开源模型。其中一个已经发布的模型是基于SigLIP的视觉语言模型。这个模型非常容易调整和扩展到多种任务。这个Colab笔记本展示了如何用简洁、易读的代码来实现这一点。SigLIP是...

2024-05-10 talkingdev

近期，关于如何扩展语言模型的语境的讨论引起了业界的关注。这次讨论并未提供太多的评估方法，但却对语言模型领域的探索方向提供了深度剖析。语言模型的语境是机器学习和自然语言处理中的关键组成部分，对于提高模型...

2024-05-02 talkingdev

理解Transformer的工作原理常常需要多次尝试。本篇博客文章通过详细解读Gemma架构，帮助读者深入理解Transformer。文章内容明了，包含了代码和图解，无论是对于初学者还是专业人士来说，都能从中获取到有价值的信息...