SliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...
Read MoreDeFlow是一种用于估计场景中三维运动的新方法,这是自动驾驶所必需的关键技能。它通过从基于体素的方法向基于点特征的方法过渡,并使用门控循环单元细化和引入新的损失函数,克服了传统体素化方法的局限性。
Read More研究人员开发出了一种新方法来创建场景图,使该过程更快速和高效。他们基于Transformer的技术专注于改进模型对图像中不同元素的理解和连接方式,从而提高了模型在挑战性任务上的性能。
Read More麻省理工学院的一个团队宣布了一种新的金属3D打印方法,该方法将打印速度和规模优先于分辨率。它能够以至少比可比金属添加制造过程快10倍的速度打印大型铝制品。该技术利用了一层100微米玻璃珠来创建一个结构,然后...
Read More最近,一种名为DiverseEvol的新方法在GitHub上发布,它可以让AI模型选择自己的训练数据,使其在不需要人工或其他先进AI系统的帮助下变得更好。DiverseEvol方法包括两个步骤:第一步是从数据集中选择用于训练模型的样...
Read More针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...
Read More研究人员开发了一种新方法,称为相互蒸馏学习(MDPR),通过结合两种不同的技术,增强了人物再识别。该方法利用两个网络相互学习,一个网络学习到了身份特征,另一个网络学习到了外观特征,从而提高了人物再识别的准确...
Read More