ResNet的相关内容 - 漫话开发者

2025-08-01 talkingdev

[论文推荐] FGFP框架：基于分数阶高斯滤波与剪枝的深度神经网络压缩技术

随着深度神经网络（DNNs）在边缘设备上的应用日益广泛，网络压缩技术的重要性愈发凸显。针对现有方法在边缘设备部署上的挑战，研究者提出了一种创新的分数阶高斯滤波与剪枝（FGFP）框架。该框架将分数阶微分计算与高...

2025-05-08 talkingdev

近期arXiv平台发布的研究论文提出了一种名为IDInit的创新神经网络初始化技术，该方法通过在主层和子层结构中维持身份转换（identity transitions），有效解决了深度神经网络训练过程中的收敛稳定性难题。该技术突破...

2025-05-05 talkingdev

GitHub开源项目TScale提出了一种创新性的分布式训练解决方案，允许开发者在消费级GPU集群上高效运行大规模模型训练。该项目通过优化通信协议和资源调度算法，显著降低了分布式训练的硬件门槛，使中小型研究团队也能...

2024-05-16 talkingdev

近日，EfficientTrain++推出了一种新颖的课程学习策略，显著减少了主要视觉模型如ResNet和Swin在ImageNet数据库上的训练时间。据悉，这种新的学习策略最多可以将模型训练时间缩短三倍。EfficientTrain++的这一突破不...