论文:SliceGPT高效简化大型语言模型的新方法
talkingdev • 2024-02-01
1027227 views
SliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的任务性能。
核心要点
- SliceGPT是一种新的后训练稀疏化方案,可以减少大型语言模型的资源需求。
- 通过替换权重矩阵和减少嵌入维度,SliceGPT可以删除高达25%的模型参数。
- 在保留高达99%的任务性能的同时,SliceGPT可以增强大型语言模型的效率。