"深度学习"的相关内容 - 漫话开发者

2023-08-22 talkingdev

我如何让Stable Diffusion XL变得更智能

在这篇文章中，Max Woolf详细解释了他如何通过训练AI生成的劣质图像，使Stable Diffusion的最新版变得更好。他通过深度学习技术，让AI从错误中学习，并在此基础上进行改进。这种方法不仅提高了AI生成图像的质量，还...

2023-08-22 talkingdev

Deepmind的研究人员在最新的研究中，试图提升他们的AlphaZero象棋智能体的玩耍能力，以减少幻觉并提高广泛的创造力。他们发现，这个智能体所下的棋步类型更加多样化，能解决一些真正具有挑战性的位置谜题。看到其如...

2023-08-17 talkingdev

本文将深入探讨热门的《transformer数学101》文章，以及基于transformer架构的高性能分布式训练。变形金刚模型已经在深度学习领域广泛应用，其强大的处理能力和优异的性能表现赢得了业界的一致好评。然而，对于这种...

2023-08-16 talkingdev

虽然段落任意模型（SAM）在各种数据集的分割任务中表现优异，但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性，有效地分割食品图像，甚至识别出场景中的单个食品和其他...

2023-08-15 talkingdev

有效的RGB-D语义分割可以帮助移动机器人更好地理解他们所在的环境。尽管深度数据提供了有用的几何洞察，但它可能会带来噪声。本文介绍了一种精简的网络，该网络使用的计算功率较少，但仍然稳健，有效地融合了色彩和...

2023-08-10 talkingdev

深度神经网络在计算机视觉领域有着出色的表现，但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略，能够更好地从老师网络向学生网络传...

2023-08-04 talkingdev

SoftMoE 是一种新的模型架构，它改进了稀疏的混合专家（MoE）模型。通过使用软分配方法，每个专家处理输入令牌的子集，SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中，SoftMoE的表现超过了标准的变压...

2023-08-03 talkingdev

最新研究中，科研人员引入了一种名为‘聚焦线性注意力’的新方法，使变压器（Transformers）变得更为高效和强大。研究人员设计了新的映射函数和秩恢复模块，旨在在保持计算需求较低的同时，提升模型的性能。这一突破性...