漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-10 talkingdev

实践教程:探索Gemma 3n与MatFormer的弹性推理能力

Google最新发布的Gemma 3n和MatFormer模型采用了创新的嵌套Transformer架构,通过Mix-n-Match技术实现弹性推理功能。该技术允许模型在运行时动态调整计算资源分配,显著提升推理效率并降低计算成本。本实践教程详细...

Read More
2025-07-09 talkingdev

AI2发布全开源语言模型OLMo 2系列,32B版本超越GPT-3.5 Turbo

艾伦人工智能研究所(AI2)近日推出OLMo 2全开源语言模型家族,标志着大模型开源生态取得重大突破。该系列包含32B、13B、7B和1B四种参数规模,其中旗舰型号OLMo 2 32B成为首个在主流基准测试中同时超越GPT-3.5 Turbo...

Read More
2025-07-04 talkingdev

本地运行与微调Gemma 3N指南:基于llama.cpp与Unsloth的实践方案

谷歌最新推出的Gemma 3N模型现可通过Dynamic GGUFs技术在本地环境中运行,技术社区已实现与llama.cpp、Ollama及Open WebUI生态的无缝集成。本文详解三种部署方案的技术要点:1)利用llama.cpp的量化推理优化实现低资...

Read More
2025-06-27 talkingdev

谷歌发布多模态开源模型Gemma 3n:支持文本、图像和音频输入

谷歌近日发布了具有重大意义的新开源权重模型Gemma 3n,该模型采用多模态设计,专为设备端优化。Gemma 3n能够接受文本、图像和音频作为输入,展现了强大的跨模态处理能力。为推广该模型,谷歌与AMD、Axolotl、Docker...

Read More
2025-05-26 talkingdev

Gemma 3n架构创新解析:谷歌I/O大会发布的全新轻量化模型成员

谷歌在2024年I/O开发者大会上悄然推出了Gemma系列的新成员Gemma 3n,这一采用自由权重(free weights)设计的轻量化模型引发了AI社区的广泛关注。作为Gemma家族的最新成员,3n版本在模型架构上进行了显著创新,其技...

Read More
2025-04-26 talkingdev

[论文推荐] 无损压缩大模型:动态长度浮点技术实现70%体积缩减,GPU推理效率飞跃

来自arXiv的最新研究论文提出了一种名为DFloat11的动态长度浮点无损压缩框架,通过创新性地利用LLM权重中BFloat16格式的低熵特性,实现了30%的模型体积缩减,同时保持输出结果与原始模型的比特级一致性。该技术采用...

Read More
2025-04-16 talkingdev

谷歌发布TxGemma开源模型,加速医疗科学中的治疗发现

谷歌近日基于其Gemma模型系列推出了专为医疗科学领域优化的TxGemma开源模型。该模型在治疗方案的发现方面展现出卓越性能,不仅超越了大多数专用模型,还在所有开源通用模型中表现最佳。TxGemma的发布标志着人工智能...

Read More
2025-03-25 talkingdev

Unsloth团队成功优化Gemma 3模型,提供免费Colab训练实例

近日,Unsloth团队宣布已成功解决了来自DeepMind的新开源权重模型——Gemma 3的一些技术难题。通过与Unsloth的工具包集成,开发者现在可以在免费的Google Colab实例上对Gemma 3进行微调训练。这一突破性进展不仅降低了...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page