训练算法的相关内容 - 漫话开发者

2025-06-16 talkingdev

ParetoQ算法突破低比特量化技术瓶颈，统一二元、三元及2至4位量化方案

PyTorch官方博客最新发布的ParetoQ训练算法在低比特量化领域取得重大突破。该技术首次实现了二元（1-bit）、三元（1.58-bit）和2至4位量化的统一框架，并在所有量化级别上均达到当前最优性能。这一突破性进展尤其适...

2025-03-17 talkingdev

DeepMind近日发布了一篇详细介绍DiLoCo跨数据中心训练算法扩展定律的论文。DiLoCo是一种强大的训练算法，能够在全球范围内同步梯度，确保模型训练的稳定性。该算法通过在多个数据中心之间进行分布式训练，有效提升了...

2024-12-17 talkingdev

近日，一项新的LLM（大型语言模型）优化技术在人工智能领域引起了广泛关注。这项技术通过在模型架构和训练算法上的创新，实现了对LLM内存消耗的显著降低，从而大幅度减少了模型部署和运行的成本。具体来说，这项技术...

2024-03-18 talkingdev

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台，以优化模型训练的性能和...

2024-02-27 talkingdev

Meta最近发布了一款名为Pearls的强化学习库，该库已经在拍卖竞标系统、推荐引擎等应用中进行了部署，可以用于研究和部署。Pearls提供了一些在强化学习领域中非常实用的工具，例如，一些用于环境模拟和数据前处理的工...

2024-01-10 talkingdev

ALOHA机器人系统以其令人难以置信的烹饪和家务任务演示在互联网上引起了轰动。它使用了许多有趣的训练技术（主要是模仿学习）。该代码库包含了ALOHA系统的一些基线训练算法，用于模拟。

2023-08-21 talkingdev

贝叶斯流网络是一种新颖的架构和训练算法。这是一份简洁、非官方的论文复制品。目标是构建一个可以扩展到GPT-2大小模型的代码库。贝叶斯流网络的出现，为深度学习模型的训练带来了新的可能性，其独特的结构和训练方...

2023-06-14 talkingdev

研究人员提出了竞争性基准测试系统"AlgoPerf"，旨在公平评估各种深度学习算法的训练效果，并为未来的改进奠定基础。这一研究解决了比较和改进深度学习训练算法的挑战，这些算法是加速数据处理、节省资源和创建准确模...