微信扫码实时跟踪AI前沿
阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...
Mozilla公司最近成功训练了一款可以在浏览器内运行,并自动为网页图片生成替代文本(Alt文本)的模型。这一创新技术旨在提高网页的无障碍性,使视力障碍用户能够更好地理解网页内容。通过在本地运行模型,Mozilla不...