Tart: 提升LLMs推理能力的新方法

talkingdev • 2023-06-23

1669697 views

这项研究揭示了大型语言模型（LLMs）在处理不同任务时可以胜任，但在概率推理方面存在困难，从而限制了它们的性能。作者提出了一种名为Tart的解决方案 - 一种在通用方式下训练的推理模块，当与任何现有模型结合时，显著提高了其推理能力和在各种任务和模态下的整体性能。