漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-01 talkingdev

开源|Exposed by Default:你的浏览器正在泄露多少隐私?

近日,一个名为'Exposed by Default'的开源项目网站引发科技界与隐私安全领域的广泛关注。该网站通过实时检测,直观展示了用户浏览器在未经明确授权的情况下自动暴露的庞大数据量,这些数据共同构成了一个高度独特的...

Read More
2025-11-03 talkingdev

开源|Wavesurfer.js:交互式音频波形播放与可视化JavaScript库

Wavesurfer.js作为一款前沿的交互式JavaScript音频处理库,正在重塑Web应用的音频可视化体验。该库通过Canvas和Web Audio API技术栈,实现了高精度的音频波形渲染与实时播放控制,其模块化架构支持插件扩展,包括区...

Read More
2025-09-28 talkingdev

开源|Handy:基于Rust开发的免费开源跨平台语音转文本应用

近日,一款名为Handy的开源语音识别应用在技术社区引发关注。这款采用Rust语言编写的跨平台工具,实现了高效的实时语音转文本功能,其开源特性允许开发者自由查看和修改源代码。Handy支持Windows、macOS和Linux三大...

Read More
2025-05-06 talkingdev

Daft Punk的声乐效果技术解析:揭秘电子音乐传奇的创作奥秘

Daft Punk作为电子音乐领域的传奇组合,其作品中独特的声乐效果一直是音乐技术研究的焦点。2001年5月《Remix》杂志的罕见采访中,Daft Punk亲自透露了他们使用多种声乐处理技术的创作细节。这些技术包括但不限于声码...

Read More
2025-05-03 talkingdev

开发者耗时两年打造基于3D物理引擎的合成器Anukari,开创GPU音频处理新范式

独立开发者历时两年多打造的Anukari 3D物理合成器近日正式发布,这款创新性音频工具成为首批采用GPU进行实时音频处理的虚拟乐器之一。项目创始人在开发者日志中透露,其物理模拟系统的GUI开发难度远超预期,甚至超过...

Read More
2025-03-14 talkingdev

[开源] Audio Flamingo 2:基于Qwen的最先进音频理解模型

Audio Flamingo 2 是一个基于Qwen架构构建的最新音频理解模型,其独特之处在于几乎完全使用了合成数据进行训练。这一突破性进展不仅提升了模型在音频处理和理解任务中的表现,还展示了合成数据在AI训练中的巨大潜力...

Read More
2025-03-06 talkingdev

FlowDec:基于条件流匹配的高质量音频压缩技术

近日,GitHub上发布了一款名为FlowDec的高质量音频压缩工具。FlowDec是一款全频带音频编解码器,采用条件流匹配(conditional flow matching)和非对抗性训练(non-adversarial training)技术,能够实现48 kHz高保...

Read More
2025-03-04 talkingdev

Stability AI与Arm合作推出智能手机端实时生成音频技术

Stability AI与Arm近日宣布合作,成功将实时生成音频技术引入智能手机。通过结合Stable Audio Open和Arm KleidiAI库,双方在移动设备上实现了音频生成速度的30倍提升。这一突破性进展不仅展示了生成式AI在音频领域的...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page