HuggingFace发布针对3D并行的代码库Nanotron
talkingdev • 2024-01-23
1053564 views
近日,HuggingFace发布了一个名为Nanotron的小型而强大的库,用于训练具有3D并行性的模型。这意味着它将数据、模型和模型中的层/张量分割开来。前两种并行性在PyTorch等库中得到了很好的支持。然而,将模型张量分割开来对于每个模型来说都是定制的而且难以实现。这个库提供了有用的原语,使这个过程更容易,更不容易出错。
核心要点
- HuggingFace发布了名为Nanotron的小型而强大的库
- 这个库用于训练具有3D并行性的模型,并将数据、模型和模型中的层/张量分割开来
- Nanotron为实现模型张量分割提供了有用的原语,使这个过程更容易,更不容易出错