微信扫码实时跟踪AI前沿
SEAHORSE是一个数据集,用于评估多语言摘要系统的质量。该数据集包含96,000个摘要,这些摘要已经根据六个重要方面(清晰度、重复、语法、归因、主要观点和简洁性)由人类进行了评分。这个数据集不仅可以作为自动化...