模型的相关内容 - 漫话开发者

2023-08-18 talkingdev

KernelWarehouse提出一种构建卷积核的更智能方式

KernelWarehouse提出了一种新的动态卷积方法，通过更高效地分解和重组卷积核，为计算机视觉带来了新的可能。这种方法通过在各层之间巧妙地共享和混合预定义的部分，可以使用更少的参数，实现更大的灵活性和强大的功...

2023-08-17 talkingdev

本文将深入探讨热门的《transformer数学101》文章，以及基于transformer架构的高性能分布式训练。变形金刚模型已经在深度学习领域广泛应用，其强大的处理能力和优异的性能表现赢得了业界的一致好评。然而，对于这种...

2023-08-17 talkingdev

强化学习可能是当前对齐大型语言模型（甚至视觉模型）最好的工具。然而，当你需要大量的人类数据来训练一个奖励模型时，这就成为了一项挑战。如果你可以只使用“提示”呢？这是RLCF（强化学习计算框架）趋势的又一绝佳...

2023-08-17 talkingdev

出色的研究员Chip Huyen提出了LLM（语言模型）研究中的十大开放性挑战。首先，幻觉和上下文长度问题在当前讨论中频繁出现。然而，最有趣的可能是多模态、架构改进，以及对GPU的替代方案。目前，有许多聪明的研究人员...

2023-08-17 talkingdev

在软件开发中，提交信息起着至关重要的作用，但很多提交信息都缺乏详细的描述。最近有一篇论文提出了一个新的方法，利用过去的提交历史，而非简单地生成提交信息。这篇论文提出了一个新的数据集，名为CommitChronicl...

2023-08-16 talkingdev

OpenAI，ChatGPT的创造者，一直在使用其最先进的大型语言模型来执行公司的内容政策。对于诸如令人不安的内容、欺诈以及滥用等问题，OpenAI正在使用ChatGPT来进行自动化处理。然而，该技术仍有其局限性。在某些情况下...

2023-08-16 talkingdev

本文概述了十个关键的AI开发者工具设计原则，这些原则来自于GitHub在设计、发布和扩展Copilot的经验。这些原则包括利用自然语言、解决开发者的痛点、收集有意义的反馈、承认偏见，并优先考虑定制化、可访问性、性能...

2023-08-16 talkingdev

虚拟试穿任务，即将一图像上的衣物转移到另一图像，尤其在更高分辨率下，这项任务具有挑战性。许多方法使用生成对抗网络（GAN）。然而，本文介绍的解决方案DCI-VTON，采用了一种结合了样例基础修复和变形模块的扩散...