使用Distilabel技术的DPO数据集 talkingdev • 2024-01-12 1085248 views 一种新的方法可以过滤高质量的配对偏好以进行对齐。它可以显著提高基准模型的性能。 核心要点 新方法使用Distilabel技术提高了DPO数据集的性能 配对偏好过滤可以提高模型性能 该方法在对齐任务中具有潜在的广泛应用 Read more > 查看原文