当GPT-3.5的成本低于Llama 2时
talkingdev • 2023-08-01
1557027 views
训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本,并且受到不同计算资源的瓶颈制约。因此,某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵。这篇博客写得非常优雅,围绕模型部署考虑问题有一些非常好的工程技巧。
核心要点
- 训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本
- 某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵
- 这篇博客围绕模型部署考虑问题有一些非常好的工程技巧