3万亿的开放数据集Dolma发布,助力研究者规模化研究数据效应
talkingdev • 2023-08-21
1499642 views
虽然有许多开放数据集,但能够训练前沿模型的规模却少之又少。艾伦人工智能研究所的Dolma数据集就致力于这一目标,希望能够使研究者能够在大规模上研究数据效应。这一数据集的发布,不仅为研究者提供了更高质量,更大规模的数据,也为人工智能的发展打开了新的可能性。
talkingdev • 2023-08-21
1499642 views
虽然有许多开放数据集,但能够训练前沿模型的规模却少之又少。艾伦人工智能研究所的Dolma数据集就致力于这一目标,希望能够使研究者能够在大规模上研究数据效应。这一数据集的发布,不仅为研究者提供了更高质量,更大规模的数据,也为人工智能的发展打开了新的可能性。