漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-27 talkingdev

论文:语言模型可重复评估方法的新思路

评估语言模型一直以来都是一个复杂的任务,尤其是在大多数评估细节都只存在于大型公司内部的情况下。这篇论文展示了一套可重复且强大的评估标准,为研究人员提供了一个实用的框架。论文中包括了对困惑度评估的详细讨...

Read More
2023-09-13 talkingdev

AI模型运行速度新基准测试发布,Nvidia和Intel名列前茅

最近,MLCommons推出了一项新的基准测试,用于评估顶级硬件运行AI模型的速度。在这次的评估中,Nvidia和Intel分别获得了第一和第二的位置。这项测试的发布,不仅为科技界提供了一个公平、公正的评估标准,也为消费者...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4