微软DeepSpeed更新,fp6模型推理速度提升超过2倍 talkingdev • 2024-03-11 915127 views 微软的强大DeepSpeed训练库更新了,可以让模型每个参数使用6位。这可以将推理速度提升超过2倍。 核心要点 微软DeepSpeed库更新,fp6模型推理速度提升超过2倍 DeepSpeed训练库的更新可以让模型每个参数使用6位 这可以将推理速度提升超过2倍 Read more > 查看原文