Vibe-Eval是一个新推出的基准测试,专为测试多模态聊天模型而设计。它包含了269项视觉理解提示,其中包括100项特别具有挑战性的提示。这些视觉理解提示的设计,力求能够全面、深入地评估和测试多模态聊天模型的性能...
Read More稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型,该模型是StableLM 3B-4e1t模型的一个扩展,灵感来源于Zephyr 7B模型,旨在实现高效的文本生成,特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...
Read MoreMamba是一种非Transformer的模型,其性能惊人。它经过了SFT的聊天调优,并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。
Read MoreMeta公司发布了新的开源AI语言模型家族Llama 2,其许可证允许其被整合到商业产品中。这些模型的大小从70亿参数到7亿参数不等,据报道,它们在大多数基准测试中表现优于其他开源聊天模型。Llama 2已在Microsoft Azure...
Read More近日,InternLM在GitHub上公开了一款专为实际场景设计的基础聊天模型。该模型拥有7亿的参数,可广泛应用于各种实际场景,如客户服务、在线咨询等。InternLM的这款模型采用了先进的深度学习技术,能够理解和回应用户...
Read More