漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-22 talkingdev

我如何让Stable Diffusion XL变得更智能

在这篇文章中,Max Woolf详细解释了他如何通过训练AI生成的劣质图像,使Stable Diffusion的最新版变得更好。他通过深度学习技术,让AI从错误中学习,并在此基础上进行改进。这种方法不仅提高了AI生成图像的质量,还...

Read More
2023-08-22 talkingdev

AlphaZero棋艺创新之路:深度学习为象棋游戏带来新的变革

Deepmind的研究人员在最新的研究中,试图提升他们的AlphaZero象棋智能体的玩耍能力,以减少幻觉并提高广泛的创造力。他们发现,这个智能体所下的棋步类型更加多样化,能解决一些真正具有挑战性的位置谜题。看到其如...

Read More
2023-08-17 talkingdev

深度解析:transformer模型训练背后的数学原理

本文将深入探讨热门的《transformer数学101》文章,以及基于transformer架构的高性能分布式训练。变形金刚模型已经在深度学习领域广泛应用,其强大的处理能力和优异的性能表现赢得了业界的一致好评。然而,对于这种...

Read More
2023-08-16 talkingdev

专业的食品图像分割技术开源

虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他...

Read More
2023-08-15 talkingdev

论文:轻量级RGB-D分割技术助力移动机器人理解环境

有效的RGB-D语义分割可以帮助移动机器人更好地理解他们所在的环境。尽管深度数据提供了有用的几何洞察,但它可能会带来噪声。本文介绍了一种精简的网络,该网络使用的计算功率较少,但仍然稳健,有效地融合了色彩和...

Read More
2023-08-10 talkingdev

提升计算机视觉学生网络的方法开源

深度神经网络在计算机视觉领域有着出色的表现,但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略,能够更好地从老师网络向学生网络传...

Read More
2023-08-04 talkingdev

论文:SoftMoE,一种改进的稀疏混合专家模型,低成本提高模型容量

SoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...

Read More
2023-08-03 talkingdev

新研究提出‘聚焦线性注意力’方法,提升视觉变压器的效率与功效(GitHub Repo)

最新研究中,科研人员引入了一种名为‘聚焦线性注意力’的新方法,使变压器(Transformers)变得更为高效和强大。研究人员设计了新的映射函数和秩恢复模块,旨在在保持计算需求较低的同时,提升模型的性能。这一突破性...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page