漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-17 talkingdev

深度解析:transformer模型训练背后的数学原理

本文将深入探讨热门的《transformer数学101》文章,以及基于transformer架构的高性能分布式训练。变形金刚模型已经在深度学习领域广泛应用,其强大的处理能力和优异的性能表现赢得了业界的一致好评。然而,对于这种...

Read More
2023-08-16 talkingdev

专业的食品图像分割技术开源

虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他...

Read More
2023-08-15 talkingdev

论文:轻量级RGB-D分割技术助力移动机器人理解环境

有效的RGB-D语义分割可以帮助移动机器人更好地理解他们所在的环境。尽管深度数据提供了有用的几何洞察,但它可能会带来噪声。本文介绍了一种精简的网络,该网络使用的计算功率较少,但仍然稳健,有效地融合了色彩和...

Read More
2023-08-10 talkingdev

提升计算机视觉学生网络的方法开源

深度神经网络在计算机视觉领域有着出色的表现,但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略,能够更好地从老师网络向学生网络传...

Read More
2023-08-08 talkingdev

TorchScale——提供高效有效的Transformers扩展的PyTorch库

TorchScale是一款PyTorch库,让研究者和开发者能够更高效、更有效地扩展Transformers。它是为了满足对于大规模数据处理的需求而生的工具,通过使用TorchScale,我们可以在保持高性能的同时,实现Transformers的扩展...

Read More
2023-08-04 talkingdev

论文:SoftMoE,一种改进的稀疏混合专家模型,低成本提高模型容量

SoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...

Read More
2023-08-03 talkingdev

论文:提升脑瘤分类的新方法,用于MRI图像的L2标准化空间注意力网络

近期的一项研究提出了一种新颖的分类网络,该网络使用L2标准化空间注意力,以提高在MRI图像中识别不同类型脑瘤的准确性。这种网络的应用,将为医生在识别和分析脑瘤类型的过程中提供极大的帮助,从而提高治疗的准确...

Read More
2023-08-03 talkingdev

新研究提出‘聚焦线性注意力’方法,提升视觉变压器的效率与功效(GitHub Repo)

最新研究中,科研人员引入了一种名为‘聚焦线性注意力’的新方法,使变压器(Transformers)变得更为高效和强大。研究人员设计了新的映射函数和秩恢复模块,旨在在保持计算需求较低的同时,提升模型的性能。这一突破性...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page