音频处理的相关内容 - 漫话开发者

2026-06-10 talkingdev

Gemini 3.5 Live Translate：实时语音翻译，消除尴尬停顿，带来自然对话体验

谷歌近日发布了Gemini 3.5 Live Translate，这是一个全新的音频模型，专注于实现实时语音到语音的翻译。与传统的语音翻译相比，该模型支持超过70种语言，并致力于消除翻译过程中常见的尴尬停顿，同时保持语调和情感...

2026-05-25 talkingdev

AudioMass是一款完全免费且开源的在线音频与波形编辑平台，其最大亮点在于无需任何安装或注册，即可在浏览器中直接完成从基础剪辑到多轨混音的专业级音频处理。该工具不仅支持多轨叠加（multitrack）与录音功能，还...

2026-05-25 talkingdev

近日，一款名为AudioMass的免费、开源、多轨音频网页编辑器在Hacker News社区引发热议。该工具完全基于Web端运行，无需安装任何本地软件，即可提供功能丰富的音频波形编辑能力。与市面上其他音频编辑工具相比，Audio...

2026-01-30 talkingdev

苹果公司近日完成了对以色列初创公司Q.ai的收购，此举旨在强化其在人工智能音频处理领域的技术储备。Q.ai专注于成像与机器学习技术，尤其在两大前沿方向拥有核心专长：一是实现设备对“耳语”等极低音量语音的精准识别...

2025-12-01 talkingdev

近日，一个名为'Exposed by Default'的开源项目网站引发科技界与隐私安全领域的广泛关注。该网站通过实时检测，直观展示了用户浏览器在未经明确授权的情况下自动暴露的庞大数据量，这些数据共同构成了一个高度独特的...

2025-11-03 talkingdev

Wavesurfer.js作为一款前沿的交互式JavaScript音频处理库，正在重塑Web应用的音频可视化体验。该库通过Canvas和Web Audio API技术栈，实现了高精度的音频波形渲染与实时播放控制，其模块化架构支持插件扩展，包括区...

2025-09-28 talkingdev

近日，一款名为Handy的开源语音识别应用在技术社区引发关注。这款采用Rust语言编写的跨平台工具，实现了高效的实时语音转文本功能，其开源特性允许开发者自由查看和修改源代码。Handy支持Windows、macOS和Linux三大...

2025-05-06 talkingdev

Daft Punk作为电子音乐领域的传奇组合，其作品中独特的声乐效果一直是音乐技术研究的焦点。2001年5月《Remix》杂志的罕见采访中，Daft Punk亲自透露了他们使用多种声乐处理技术的创作细节。这些技术包括但不限于声码...