当GPT-3.5的成本低于Llama 2时

talkingdev • 2023-08-01

1557027 views

训练吞吐量、提示处理吞吐量和生成吞吐量都有不同的成本，并且受到不同计算资源的瓶颈制约。因此，某些工作负载在Llama 70B上实际上比支付GPT-3.5更昂贵。这篇博客写得非常优雅，围绕模型部署考虑问题有一些非常好的工程技巧。