Llava 1.6发布,OCR、推理和世界知识得到改进
talkingdev • 2024-02-02
1024338 views
Llava是一种视觉语言模型,最新版本为1.6,经过改进后,其OCR、推理和世界知识等方面有了很大提升,甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型,以便更多人能够使用。
核心要点
- Llava 1.6发布,视觉语言模型得到改进。
- Llava 1.6版本的OCR、推理和世界知识等方面有了很大提升。
- Llava团队计划发布数据、代码和模型,以便更多人能够使用。