谷歌近日发布了Gemma 3模型的权重和技术报告,这一模型共有四种规模,其性能与Gemini 1.5 Pro相当。Gemma 3不仅在多语言处理上表现出色,能够理解超过140种语言,还被认为是接近当前最先进的密集模型之一。这一发布...
Read MoreMistral公司与Nvidia携手研发的全新多语言模型Nemo 12B已经正式发布。这款模型采用了全新的分词器进行训练,展现出了强大的多语言和英语处理能力。值得一提的是,Nemo 12B还支持128k的上下文。这种强大的性能,无疑...
Read MoreCohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...
Read More