创意的相关内容 - 漫话开发者

2025-05-21 talkingdev

谷歌发布Veo 3、Imagen 4及影视制作新工具Flow，生成式媒体模型再升级

在2025年谷歌I/O大会上，谷歌正式推出新一代生成式媒体模型Veo 3和Imagen 4，以及专为影视制作设计的新工具Flow。Veo 3作为视频生成模型的迭代版本，在动态细节和场景连贯性上实现突破；Imagen 4则进一步提升了文本...

2025-05-05 talkingdev

一篇题为《Dummy's Guide to Modern LLM Sampling》的技术指南近期在开发者社区引发热议，该文章系统性地解读了现代大语言模型(LLM)中的采样技术。作为自然语言生成的核心组件，采样策略直接决定了文本输出的质量和...

2025-05-03 talkingdev

音乐生成技术平台Suno近日发布了其最新版本v4.5，该版本进一步拓展了AI音乐创作的边界，为用户提供了更多样化的音乐风格选择。Suno v4.5的发布在技术社区引发了广泛关注，相关讨论在Hacker News上获得了278个点赞和1...

2025-04-30 talkingdev

清华大学知识工程组（KEG）与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目，该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...

2025-04-26 talkingdev

一位开发者长期以来的创意构想终于得以实现——通过OpenAI最新发布的图像API，将家庭照片转化为可爱的涂色书图案，并整合印刷服务完成个性化定制。该项目最初尝试使用OpenAI的Sora工具手动处理图片，但单本书籍需耗时...

2025-04-25 talkingdev

Adobe近日发布了Firefly的重大更新，此次更新不仅整合了图像、视频、音频及矢量生成工具，还新增了移动端支持，并进一步深化了与Creative Cloud的集成。这一举措标志着Adobe在创意AI领域的又一重要突破，为设计师和...

2025-04-22 talkingdev

知名开发平台Stackblitz（Bolt的创造者）宣布将于5月30日举办全球规模最大的非专业开发者与氛围编程者（vibe coders）黑客马拉松活动，面向全球参与者开放。该赛事突破传统黑客松的技术门槛限制，首次将焦点对准非技...

2025-04-22 talkingdev

写作质量奖励模型（Writing Quality Reward Models, WQRM）作为评估创意写作质量的新方法，正在重塑AI内容生成领域的技术范式。该模型通过强化学习框架提供可量化的质量反馈，不仅能精准评估文本创作水平，更可作为...