对齐更长更好 talkingdev • 2024-02-20 972899 views 使用偏好数据对齐语言模型时,往往难以确定应该使用哪些示例。这项工作提出了一个出乎意料的稳健基准 - 选择1,000个最长的示例来进行对齐。 核心要点 选择最长的1,000个示例可作为语言模型对齐的稳健基准 使用偏好数据对齐语言模型时存在挑战 这项工作提供了一种简单而有效的解决方案 Read more > 查看原文