样本效率的相关内容 - 漫话开发者

2025-05-09 talkingdev

[论文推荐]基于离线数据的Actor-Critic学习算法实现近最优样本效率

强化学习领域取得重要突破，研究人员开发出一种新型actor-critic算法，通过结合离线数据和针对性探索，在混合强化学习场景中实现了接近最优的样本效率。该研究解决了长期困扰强化学习领域的核心挑战——如何在有限的实...

2025-01-23 talkingdev

TREAD：无需修改架构的扩散模型高效训练新方法

近日，一项名为TREAD（Token Routing for Efficient Architecture-agnostic Diffusion Training）的新技术引起了广泛关注。该技术通过创新的Token Routing机制，显著提升了扩散模型（Diffusion Models）的样本效率，...

2024-02-01 talkingdev

论文：苹果应用“Up captioning”技术，加快预训练收敛速度

苹果公司在人工智能系统中应用“Up captioning”技术来提高训练时的标签质量。该公司将此技术应用于预训练中，通过将C4重述为问题/答案对、指令等，加快了模型的收敛速度10倍，使模型的样本效率显著提高。但这也会增加...

2024-01-31 talkingdev

基于Transformer的大词汇量3D扩散模型

3D对象生成的一个关键挑战是可以创建的物品的多样性。本研究使用修改后的架构来提高样本效率，并将系统扩展到可以处理每个3D类别中更大的对象集。