漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-05 talkingdev

开源项目:AWQ技术让大型AI模型更小更快

最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7