微信扫码实时跟踪AI前沿
一篇来自LessWrong社区的技术文章深入探讨了2023年至2031年间大型语言模型(LLM)规模扩展的物理极限。文章指出,虽然预训练算力是决定模型规模的关键,但一个常被忽视的硬性约束在于推理时的令牌生成速度。具体来说...