微信扫码实时跟踪AI前沿
近日,一项名为L-Eval的项目引起了广泛关注。该项目旨在为长篇语境语言模型提供一套标准化的评估工具。L-Eval评估套件包含了超过2000个跨领域的查询-回应对,能够全面而系统地评估各种长篇语境语言模型的性能。通过...