漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-22 talkingdev

HuggingFace发布4位标准浮点数模型 (GitHub仓库)

HuggingFace发布了新的研究成果,使得在普通硬件上能够完成对65B参数模型的微调。这项研究使得量化技术不再局限于推理阶段,而是可以应用于训练过程中,从而大幅减少了模型所需空间。以下是该研究的三个核心点: -...

Read More
2023-05-04 talkingdev

小模型备受欢迎,但能追赶上大模型吗?

在自然语言处理中,大型语言模型的推理能力往往比小型模型更强。这种推理能力有助于解决困难的任务,并可能使语言模型成为下一代计算平台/操作系统的基础。通过代码训练、思维链提示和强化学习等技术,可以提高模型...

Read More
  1. Prev Page
  2. 28
  3. 29
  4. 30