使用Manifold Markets的5000个问题测试GPT-4的准确性,结果显示它的预测存在过度自信现象
talkingdev • 2023-11-09
1269693 views
近日,一项使用Manifold Markets的5000个问题测试GPT-4准确性的研究结果显示,GPT-4在预测时存在过度自信的现象。研究人员发现,GPT-4所给出的答案在很多情况下都是正确的,但其自信度却远远超过了正确率。这种过度自信的现象可能源于训练数据的问题,也可能是模型本身的问题。研究人员表示,这个问题需要更多的研究和探讨。
核心要点
- GPT-4在5000个问题的测试中,预测存在过度自信现象
- GPT-4的答案很多情况下都是正确的,但其自信度却远远超过了正确率
- 问题可能源于训练数据或模型本身,需要更多的研究和探讨