ConceptMath是一种新的双语基准,用于测试LLMs在英语和中文的数学技能。它的独特之处在于它将数学问题分解为特定的概念,从而允许更详细地评估AI在数学上的优势和劣势。 这项技术将有助于开发更准确的AI模型,以应对...
Read More研究人员创建了OpenMathInstruct-1,这是一个用于训练开源大型语言模型数学的新数据集,可与闭源模型的性能相匹配。这一突破包含180万个问题解决对,为更加可访问和有竞争力的数学教学AI工具打开了大门。
Read More研究人员开发了一种新技术,通过使用基础模型自主选择高质量的数学内容来提高语言模型在数学方面的能力。这种新技术利用基础模型来选择数学内容,然后将其注入到现有的语言模型中,以提高其在数学方面的表现。这项技...
Read MoreGoogle开发了一种名为OPRO(Optimization by PROmpting)的技术,通过人类风格的鼓励,如“让我们一步一步思考”,来提高LLMs的数学技能。这种方法实际上是在AI的计算过程中注入了人类的思维方式,使其在解决问题时更...
Read More这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...
Read More