多语言处理的相关内容 - 漫话开发者

2025-04-06 talkingdev

OCR pipeline革新ML训练：支持表格、图表、数学公式及多语言处理

近日，一款专注于ML训练的OCR pipeline技术引发业界关注。该工具创新性地支持表格、图表、数学公式等复杂结构的识别，并具备多语言处理能力，为机器学习数据预处理提供了高效解决方案。其核心优势在于通过优化的算法...

2025-03-17 talkingdev

最近，一项名为WSI的研究将Whisper自动语音识别（ASR）编码器重新应用于多语言说话人识别任务，通过联合损失优化技术实现了显著的性能提升。该技术在多语言和多样化环境中识别说话人时，表现优于现有主流模型如Pyann...

2025-03-13 talkingdev

谷歌近日发布了Gemma 3模型的权重和技术报告，这一模型共有四种规模，其性能与Gemini 1.5 Pro相当。Gemma 3不仅在多语言处理上表现出色，能够理解超过140种语言，还被认为是接近当前最先进的密集模型之一。这一发布...

2024-07-19 talkingdev

Mistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练，展现出了强大的多语言和英语处理能力。值得一提的是，Nemo 12B还支持128k的上下文。这种强大的性能，无疑...

2024-04-08 talkingdev

Cohere公司近日推出了Command R+，这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型（LLM）。Command R+具备先进的检索增强生成功能，并支持引用，同时覆盖10种关键语言的多语言处理能力，以及工具使...