漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-21 talkingdev

苹果开源基于Jax的深度学习库AX

近日,苹果公司发布了一款新的深度学习库AX,该库基于Jax构建。值得一提的是,AX支持基于编译器的并行性,可实现大规模训练,这是许多其他流行框架所不具备的功能。在过去的几年中,深度学习领域的研究和应用取得了...

Read More
2023-06-14 talkingdev

"AlgoPerf"新基准测试系统可有效提高深度学习算法训练效率(GitHub Repo)

研究人员提出了竞争性基准测试系统"AlgoPerf",旨在公平评估各种深度学习算法的训练效果,并为未来的改进奠定基础。这一研究解决了比较和改进深度学习训练算法的挑战,这些算法是加速数据处理、节省资源和创建准确模...

Read More
2023-05-22 talkingdev

HuggingFace发布4位标准浮点数模型 (GitHub仓库)

HuggingFace发布了新的研究成果,使得在普通硬件上能够完成对65B参数模型的微调。这项研究使得量化技术不再局限于推理阶段,而是可以应用于训练过程中,从而大幅减少了模型所需空间。以下是该研究的三个核心点: -...

Read More
2023-04-18 talkingdev

一分钟读懂:Cerebras-GPT:利用开放式计算实现高效可扩展的语言模型

以下是新闻主要内容: - Cerebras-GPT是一种计算优化的语言模型系列,通过利用高效的预训练、扩展和最大更新参数化,展示了先进的预训练和下游目标的训练效率。 - 作为第一个比较计算优化的模型扩展的开放和可重现...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5