实时语音翻译的相关内容 - 漫话开发者

2026-06-10 talkingdev

Gemini 3.5 Live Translate：实时语音翻译，消除尴尬停顿，带来自然对话体验

谷歌近日发布了Gemini 3.5 Live Translate，这是一个全新的音频模型，专注于实现实时语音到语音的翻译。与传统的语音翻译相比，该模型支持超过70种语言，并致力于消除翻译过程中常见的尴尬停顿，同时保持语调和情感...

OpenAI近日发布了一份工程指南，详细介绍了如何使用其最新优化的模型gpt-realtime-translate构建实时语音翻译系统。该模型专为同声传译场景设计，与传统的轮次语音交互不同，它能实现对语音流进行实时、连续的翻译处...

谷歌视频会议平台Google Meet近日宣布推出实时语音翻译功能，该功能基于DeepMind开发的先进音频语言模型，能够在翻译过程中保留说话者的声音、语调和表达方式。这一技术的突破性在于它不仅实现了语言的即时转换，还...