图像生成的相关内容 - 漫话开发者

2026-04-17 talkingdev

Codex全面升级：迈向全计算机自动化，重塑开发者工作流

OpenAI近日对Codex进行了重大更新，将其功能边界从代码生成扩展至近乎全栈的计算机自动化。新版Codex for macOS和Windows引入了后台计算机控制、多智能体工作流以及与开发者工具的深度集成，标志着其角色已覆盖软件...

2026-04-14 talkingdev

DeepMind的研究团队近日在arXiv上发布了一项名为“弹性循环Transformer”的创新工作，为视觉生成模型领域带来了显著的效率突破。传统视觉生成模型通常依赖堆叠大量独立的Transformer层，导致参数量庞大。ELT的核心创新...

2026-03-30 talkingdev

近日，GitHub上开源了一个名为Pretext的纯JavaScript/TypeScript库，专注于解决前端开发中多行文本的高性能测量与布局问题。该库通过直接调用浏览器字体引擎实现自有文本测量逻辑，有效规避了传统DOM操作中因重排（r...

2026-02-10 talkingdev

人工智能开源社区Hugging Face近日在NPM上发布了Transformers.js v4的预览版本，标志着在Web端及JavaScript生态系统中部署和运行机器学习模型的能力迈入了新的阶段。Transformers.js的核心价值在于允许开发者直接在...

2026-02-05 talkingdev

近期，一个值得关注的现象是Mac Mini在全球多地售罄，其背后驱动力并非传统创意软件需求，而是用户将其作为运行AI智能体（Agent）的无头（headless）服务器，以实现工作流程自动化。这一趋势的核心是开源框架OpenCla...

2026-01-24 talkingdev

据The Information报道，谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型，其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...

2026-01-19 talkingdev

近日，知名开发者antirez在GitHub上开源了项目“flux2.c”，该项目实现了当前热门的Flux 2图像生成模型的纯C语言推理引擎。这一举措在技术社区引发了广泛关注，在Hacker News上获得了285点热度并积累了112条深度讨论。...

2026-01-14 talkingdev

近日，开源社区迎来一款名为GLM-Image的工业级离散自回归图像生成模型，其采用了一种创新的混合架构，将自回归模块与扩散解码器相结合，标志着生成式AI在图像合成领域的技术路线探索进入新阶段。该模型的核心优势在...