漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-27 talkingdev

ElevenLabs推出高精度多语言转录模型Scribe,支持99种语言

ElevenLabs近日宣布推出其自主研发的转录模型Scribe,该模型支持99种语言,并具备高精度转录能力。Scribe不仅提供词级时间戳和说话人分离功能,还能适应真实世界中的各种音频环境。这一技术的推出将极大提升语音转文...

Read More
2024-05-26 talkingdev

开源离线语音转写服务,支持区分多人会话和LLM摘要

最近,一家技术公司推出了一款自主研发的离线语音转写和说话人分离服务,服务还提供LLM(语言模型)摘要。这款服务可以帮助用户快速准确地将语音转换为文本,并将不同说话人的语音分离。此外,LLM摘要还可以帮助用户...

Read More