LLaVa的相关内容 - 漫话开发者

2024-03-13 talkingdev

FastV: 优化视觉语言模型效率方法开源

该项目提出了一种改善大型视觉语言模型（例如LLaVA-1.5、QwenVL-Chat和Video-LLaVA）效率的方法，解决了“低效的注意力”问题。使用FastV这种新方法，通过修剪视觉令牌和学习自适应注意力模式来优化这些模型，从而显著...

2024-02-22 talkingdev

近日，GitHub推出了一项新的方法，可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器，有效地保护这些模型免受恶意图像攻击，提高了它们在现实应用中的可靠...

2024-02-06 talkingdev

Ollama最近发布了对视觉模型的支持。Llava 1.6版本更新了支持，包括Python和JavaScript包中的视觉功能。

2024-02-02 talkingdev

FireLlava是一个新的开源视觉模型，经过数据训练，可以用于商业任务。它与原始Llava的性能相当，但还没有达到Llava 1.5的水平。

2024-02-02 talkingdev

Llava是一种视觉语言模型，最新版本为1.6，经过改进后，其OCR、推理和世界知识等方面有了很大提升，甚至在某些任务上可以与Gemini相媲美。Llava团队计划发布数据、代码和模型，以便更多人能够使用。

2024-01-12 talkingdev

Ollama现在支持视觉模型啦，这意味着您可以在MacBook Pro上运行Llava，实现最先进的视觉和语言性能。随着人工智能技术的发展，AI的应用场景越来越广泛。然而，由于许多私人AI的计算能力和算法限制，它们往往无法像...

2024-01-09 talkingdev

LLaVA-Phi是一款创新的多模态助手，它使用Phi-2语言模型。尽管参数只有2.7B，但LLaVA-Phi在多模态对话中表现出色，结合了文本和视觉。该助手可以在多个领域内使用，例如智能家居和自动驾驶等。

2023-12-25 talkingdev

Llava是一个强大的多模型模型。该交互式设计现在允许聊天式交错文本、图像输入和图像输出。Llava是一个深度学习模型，能够对文本和图像数据进行联合建模，并产生准确的输出。与其他模型不同的是，Llava模型不仅考虑...