聊天模型的相关内容 - 漫话开发者

2024-05-07 talkingdev

Vibe-Eval开源：评估多模态聊天模型基准测试

Vibe-Eval是一个新推出的基准测试，专为测试多模态聊天模型而设计。它包含了269项视觉理解提示，其中包括100项特别具有挑战性的提示。这些视觉理解提示的设计，力求能够全面、深入地评估和测试多模态聊天模型的性能...

2023-12-12 talkingdev

稳定性人工智能公司发布了StableLM Zephyr 3B稳定聊天模型，该模型是StableLM 3B-4e1t模型的一个扩展，灵感来源于Zephyr 7B模型，旨在实现高效的文本生成，特别是在指令跟踪和问答上下文中。该模型已经使用直接偏好...

2023-12-11 talkingdev

Mamba是一种非Transformer的模型，其性能惊人。它经过了SFT的聊天调优，并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。

2023-07-19 talkingdev

Meta公司发布了新的开源AI语言模型家族Llama 2，其许可证允许其被整合到商业产品中。这些模型的大小从70亿参数到7亿参数不等，据报道，它们在大多数基准测试中表现优于其他开源聊天模型。Llama 2已在Microsoft Azure...

2023-07-08 talkingdev

近日，InternLM在GitHub上公开了一款专为实际场景设计的基础聊天模型。该模型拥有7亿的参数，可广泛应用于各种实际场景，如客户服务、在线咨询等。InternLM的这款模型采用了先进的深度学习技术，能够理解和回应用户...