CPO策略的相关内容 - 漫话开发者

2024-01-21 talkingdev

CPO策略提高翻译语言模型的能力

该项目提出了对比优化策略(CPO)，以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型，解决了监督微调的局限性，并取得了改进。CPO策略通过对模型的预训练进行增量式微调，有助于提高机器翻译...