漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2026-01-09 talkingdev

开源|Sopro TTS:仅1.69亿参数,支持零样本语音克隆的轻量级CPU端模型

近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...

Read More
2025-12-28 talkingdev

中国拟出台拟人化AI监管新规:要求服务商每两小时主动向用户明示AI身份

据彭博社报道,中国相关部门近期发布了一份关于拟人化人工智能系统使用的监管规则草案,旨在加强对该前沿技术应用的规范。草案核心要求之一是,提供拟人化AI服务的公司必须在用户登录时,以及此后至少每两小时,明确...

Read More
2025-11-26 talkingdev

[开源]TEN框架开源:专为对话式语音AI智能体打造的全新开发平台

近日,TEN框架在GitHub平台正式开源,这是一个专门为对话式语音AI智能体设计的开源开发框架。该框架的发布标志着语音交互AI领域迎来了重要的技术突破,为开发者提供了构建复杂语音对话系统的标准化工具集。TEN框架支...

Read More
2025-11-25 talkingdev

Vercel发布首款原生iOS应用v0:基于React Native与Expo打造流畅AI聊天体验

Vercel工程团队近日正式发布其首款原生iOS应用v0,该应用采用React Native与Expo框架进行开发,重点聚焦于构建流畅且令人愉悦的AI聊天交互体验。在开发过程中,团队面临键盘响应、滚动优化及实时内容流处理三大技术...

Read More
2025-10-14 talkingdev

开源|Steel Browser:专为AI智能体与自动化应用打造的全能浏览器API

近日,开源项目Steel Browser在GitHub发布,为AI智能体与自动化应用提供了完整的浏览器控制解决方案。该项目通过Puppeteer实现全功能浏览器操控,支持会话管理、代理配置、插件扩展及资源优化等核心功能。其创新性在...

Read More
2025-09-28 talkingdev

在微型星球上送信:这款WebGL游戏如何用前沿技术重塑交互体验

近日,一款名为《Messenger》的WebGL游戏引发科技社区广泛关注,该游戏允许玩家在微型星球表面进行信息传递任务,展示了WebGL技术在浏览器端实现复杂3D渲染的潜力。游戏通过物理引擎模拟星球重力环境,结合低多边形...

Read More
2025-09-19 talkingdev

开源|Deep Chat:一行代码为网站添加可定制AI聊天组件

Deep Chat是一款高度可定制的AI聊天组件,开发者仅需一行代码即可将其集成到网站中。该项目支持文件共享、摄像头调用、语音通信、Markdown渲染等先进功能,并能无缝对接OpenAI、Hugging Face等主流AI平台的API接口。...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page