漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2026-01-09 talkingdev

开源|Sopro TTS:仅1.69亿参数,支持零样本语音克隆的轻量级CPU端模型

近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...

Read More
2025-12-18 talkingdev

开源|Chatterbox:支持情感控制与零样本语音克隆的SOTA开源TTS模型发布

近日,由Resemble AI团队在GitHub上开源了名为Chatterbox的文本转语音模型,标志着开源TTS领域迈入了一个新的技术高度。该项目被定位为当前最先进的开源TTS解决方案,其核心亮点在于集成了多语言支持、精细化的情感...

Read More
2025-11-22 talkingdev

[开源] AI视频创作新突破:Video-Materials-AutoGEN-Workstation实现全流程自动化生成

GitHub平台近日出现一款名为Video-Materials-AutoGEN-Workstation的开源项目,标志着AI视频创作工具进入全新发展阶段。该项目通过集成内容策划、AI文案生成、TTS批量配音、AI图片合成、ASR字幕提取及自由创作六大核...

Read More
2025-10-13 talkingdev

论文推荐|ReasoningBank:基于推理记忆实现智能体自我进化的突破性框架

清华大学与斯坦福大学联合研究团队近日发布突破性研究成果ReasoningBank,该框架通过构建推理记忆系统解决长期困扰大语言模型智能体的历史经验复用难题。传统智能体在持续执行现实任务时,往往将每次交互视为独立事...

Read More
2025-07-21 talkingdev

开发者分享:如何加速ZSH shell的加载速度

近日,开发者Scott Spence在其博客中分享了优化ZSH shell加载速度的实用技巧,引发了技术社区的广泛关注。ZSH作为一款功能强大的Unix shell,因其高度可定制性和丰富的插件生态而深受开发者喜爱。然而,随着插件和配...

Read More
2025-07-11 talkingdev

Cactus:支持手机部署LLM/VLM/TTS跨平台框架

开发者Henry和Roman近日推出开源项目Cactus,这是一个专为智能手机设计的跨平台框架,支持本地部署大型语言模型(LLM)、视觉语言模型(VLM)和文本转语音(TTS)模型。与Ollama专注于笔记本和边缘服务器不同,Cactu...

Read More
2025-07-08 talkingdev

🗣️ Rime推出极具个性的AI语音技术,引领人机交互新趋势

Rime公司近日推出了市场上最逼真、最具表现力的AI语音技术,能够创造出听起来像普通人而非机器人或配音演员的智能语音体验。这一技术不仅显著提升了用户体验,还为像达美乐这样的品牌带来了两位数的转化率增长。Rime...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page