RFT方法的相关内容 - 漫话开发者

2023-09-06 talkingdev

论文：提升数学技能的研究新突破

这项研究探讨了大型语言模型（LLMs）解决数学问题的能力，及各种不同因素如何影响它们的能力。研究人员发现，一种名为“拒绝采样精细调整”（Rejection sampling Fine-Tuning, RFT）的方法有助于这些模型在数学上的提...