内容创作的相关内容 - 漫话开发者

2025-12-18 talkingdev

开源|Chatterbox：支持情感控制与零样本语音克隆的SOTA开源TTS模型发布

近日，由Resemble AI团队在GitHub上开源了名为Chatterbox的文本转语音模型，标志着开源TTS领域迈入了一个新的技术高度。该项目被定位为当前最先进的开源TTS解决方案，其核心亮点在于集成了多语言支持、精细化的情感...

2025-12-18 talkingdev

知名开源直播与录屏软件OBS Studio近日宣布，其核心渲染引擎迎来重大更新。根据官方博客发布的公告，开发团队正在为OBS Studio引入一个全新的渲染器。这一底层技术革新旨在解决当前版本在特定硬件配置、高分辨率高帧...

2025-12-13 talkingdev

近日，科技巨头谷歌应迪士尼公司发出的法律函件要求，从其旗下视频平台YouTube上移除了数十个由人工智能生成的视频，这些视频的内容均涉及描绘迪士尼旗下知名卡通角色。此次事件源于迪士尼向谷歌正式发送了一封“停止...

2025-12-12 talkingdev

谷歌近日正式向开发者开放了其强大的Gemini深度研究（Gemini Deep Research）功能，通过全新的交互API（Interactions API）提供服务。这一举措标志着AI在复杂信息处理与综合能力方面迈出了重要一步。Gemini深度研究...

2025-12-10 talkingdev

近日，一项名为Saber的零样本视频生成框架引起了人工智能与计算机视觉领域的广泛关注。该框架的核心突破在于，能够仅依据单张参考图像和文本提示，生成与参考对象身份高度一致的高质量视频。其技术关键在于，整个训...

2025-12-02 talkingdev

近日，GitHub上开源了一个名为ViBT（Vision Bridge Transformer）的项目，该项目将布朗桥模型（Brownian Bridge Models）扩展至高达200亿参数规模，专门用于高效的图像与视频条件生成任务。ViBT的核心创新在于其采用...

2025-11-26 talkingdev

人工智能研究领域迎来重大突破——Nano Banana Pro通过工具调用技术重新定义了信息图生成的边界。该模型能够主动抓取多源数据并进行智能合成，在保持原始数据准确性的基础上，通过算法优化生成具有视觉表现力的信息图...

2025-11-26 talkingdev

根据Charm.io最新数据，TikTok Shop在2025年1月至10月期间实现爆发式增长：美国市场销售额突破100亿美元，覆盖60万内容创作者，较去年同期50亿美元实现翻倍。更值得关注的是，其全球销售额已达到与老牌电商平台eBay...