漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-14 talkingdev

谷歌发布VaultGemma:全球最大具备差分隐私训练的开源10亿参数LLM

谷歌研究团队正式推出VaultGemma模型,这是目前全球最大的基于差分隐私技术从头训练的开源大语言模型,参数量达到10亿级别。该模型已在Hugging Face和Kaggle平台开放访问。VaultGemma采用严格的差分隐私训练框架,在...

Read More
2025-09-10 talkingdev

Firefox本地AI运行时性能大幅提升,推理速度最高加快10倍

Mozilla近日宣布对Firefox浏览器的AI运行时进行重大架构升级,将原本基于WebAssembly的“onnxruntime-web”替换为直接集成到浏览器底层的原生C++ ONNX Runtime。这一技术革新使Firefox的本地AI功能获得2-10倍的推理性...

Read More
2025-08-29 talkingdev

D2:用文本生成精美图表的新一代编程语言

D2是一种革命性的领域特定语言(DSL),它通过简洁的文本描述自动生成专业级图表,彻底改变了传统的图表创建方式。该技术采用先进的解析引擎和渲染系统,支持包括专业主题、手绘草图风格、动态动画效果等现代化功能...

Read More
2025-08-17 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出高性能版本Imagen 4 Fast。这一里程碑式更新标志着谷歌在多模态AI领域取得重要突破,开发者可通过API直接调用具...

Read More
2025-08-16 talkingdev

谷歌Gemini API全面开放Imagen 4系列模型,Imagen 4 Fast同步亮相

谷歌开发者博客宣布,其先进的文本生成图像模型Imagen 4系列现已在Gemini API中全面开放使用,同时推出性能优化的Imagen 4 Fast版本。这一里程碑式更新标志着多模态AI技术进入工业化应用阶段,开发者可基于该API实现...

Read More
2025-08-05 talkingdev

开源|Qwen-Image:突破性图像基础模型实现原生文本渲染

Qwen-Image作为一款200亿参数的MMDiT架构图像基础模型,在复杂文本渲染和精准图像生成领域取得重大突破。该模型不仅能实现多语言(包括字母文字和表意文字)的多行文本布局和段落级语义生成,还能保持编辑过程中的语...

Read More
2025-07-10 talkingdev

Bria开源T2I模型BRIA-3.2:参数仅4B却媲美Flux画质

视觉AI平台服务商Bria近日在Hugging Face发布新一代开源文本生成图像模型BRIA-3.2,其技术突破引发行业关注。该模型仅用4B参数即实现与Adobe Firefly 4.0和Flux[Dev]相当的图像生成质量,且模型体积缩小至三分之一,...

Read More
2025-06-30 talkingdev

PyTorch与vLLM深化集成,提升大语言模型推理效率

PyTorch与vLLM近日宣布深化技术整合,新增支持量化、注意力机制定制及异构硬件加速等关键功能。这一合作标志着两大开源框架在优化大语言模型(LLM)推理性能方面取得重要突破:量化技术可降低模型计算资源消耗达4-8...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page