Giskard开源：针对从表格到LLMs的模型测试框架

talkingdev • 2023-12-12

1174132 views

Giskard是一个开源的测试框架，用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力，还可以测量它的稳定性、可解释性和鲁棒性。Giskard的目标是提供一个全面的测试解决方案，使机器学习模型更加可靠和可解释。