漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-10 talkingdev

开源|Transformers.js v4预览版发布:WebGPU加速,JavaScript生态迎来原生AI推理新纪元

人工智能开源社区Hugging Face近日在NPM上发布了Transformers.js v4的预览版本,标志着在Web端及JavaScript生态系统中部署和运行机器学习模型的能力迈入了新的阶段。Transformers.js的核心价值在于允许开发者直接在...

Read More
2026-02-05 talkingdev

OpenClaw:开源AI自动化框架,或成苹果智能战略的“错失良机”

近期,一个值得关注的现象是Mac Mini在全球多地售罄,其背后驱动力并非传统创意软件需求,而是用户将其作为运行AI智能体(Agent)的无头(headless)服务器,以实现工作流程自动化。这一趋势的核心是开源框架OpenCla...

Read More
2026-01-24 talkingdev

谷歌收购Common Sense Machines,AI新秀可将2D图像生成3D资产

据The Information报道,谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型,其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...

Read More
2026-01-19 talkingdev

开源|Flux 2图像生成模型迎来纯C语言推理实现:性能与可移植性新突破

近日,知名开发者antirez在GitHub上开源了项目“flux2.c”,该项目实现了当前热门的Flux 2图像生成模型的纯C语言推理引擎。这一举措在技术社区引发了广泛关注,在Hacker News上获得了285点热度并积累了112条深度讨论。...

Read More
2026-01-14 talkingdev

开源|GLM-Image:融合自回归与扩散解码的工业级图像生成模型问世,专攻文本渲染与知识密集型场景

近日,开源社区迎来一款名为GLM-Image的工业级离散自回归图像生成模型,其采用了一种创新的混合架构,将自回归模块与扩散解码器相结合,标志着生成式AI在图像合成领域的技术路线探索进入新阶段。该模型的核心优势在...

Read More
2025-12-10 talkingdev

Saber:零样本参考图像生成视频新框架,无需昂贵三元组数据

近日,一项名为Saber的零样本视频生成框架引起了人工智能与计算机视觉领域的广泛关注。该框架的核心突破在于,能够仅依据单张参考图像和文本提示,生成与参考对象身份高度一致的高质量视频。其技术关键在于,整个训...

Read More
2025-12-02 talkingdev

开源|苹果发布STARFlow与STARFlow-V:基于Transformer自回归流的图像与视频生成新突破

苹果公司在Hugging Face平台开源了STARFlow与STARFlow-V模型,标志着图像与视频生成领域迎来了一项重要的技术进展。STARFlow是一种创新的Transformer自回归流模型,其核心在于巧妙地将自回归模型强大的表达能力与归...

Read More
2025-11-26 talkingdev

Nano Banana Pro突破AI图像生成边界:工具调用实现智能信息图创作

人工智能研究领域迎来重大突破——Nano Banana Pro通过工具调用技术重新定义了信息图生成的边界。该模型能够主动抓取多源数据并进行智能合成,在保持原始数据准确性的基础上,通过算法优化生成具有视觉表现力的信息图...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page