漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-26 talkingdev

Local-SGD:谷歌开源高效LLM训练方法

研究人员探索了一种名为异步Local-SGD的新的语言模型训练方法。这种方法是联邦平均的一种变体。

Read More
2024-01-11 talkingdev

谷歌开源1.6T MoE模型

谷歌的开关Transformer是最早成功的专家混合模型之一。现在,该模型的代码已经在HuggingFace平台上发布,供人们使用。

Read More
2023-07-21 talkingdev

苹果开源基于Jax的深度学习库AX

近日,苹果公司发布了一款新的深度学习库AX,该库基于Jax构建。值得一提的是,AX支持基于编译器的并行性,可实现大规模训练,这是许多其他流行框架所不具备的功能。在过去的几年中,深度学习领域的研究和应用取得了...

Read More
  1. Prev Page