最近,研究人员提出了一种新方法,称为SLEB,可以通过剪枝冗余的变压器块来加速大型语言模型(LLMs)的训练和推理。该方法可以减少存储空间和计算成本,同时保持模型的准确性。SLEB通过自适应的剪枝技术来删除冗余的...
Read More随着大型语言模型与外部工具的配对越来越多,数据泄露的新风险已经出现。本文介绍了一种系统性的方法来评估这些人工智能系统保护私人信息的能力。 研究人员发现,当前的大型语言模型在保护隐私方面存在一些问题。它...
Read More研究人员开发了一种新技术,通过使用基础模型自主选择高质量的数学内容来提高语言模型在数学方面的能力。这种新技术利用基础模型来选择数学内容,然后将其注入到现有的语言模型中,以提高其在数学方面的表现。这项技...
Read More近日,一篇名为《ImplicitDeepfake1》的论文在计算机图形学领域引起了广泛关注。该论文提出了一种新方法,将deepfake技术与Neural Radiance Fields(NeRFs)和Gaussian Splatting(GS)相结合,用于创建高度逼真的3D...
Read More最新研究表明,长视频理解领域存在多粒度噪声对应问题,影响了视频语言研究的准确性。为了解决这一问题,研究人员开发了一种名为Norton的新方法,应用了最优传输算法来提高长期视频理解。该方法通过处理多粒度噪声对...
Read MoreSliceGPT引入了一种新的后训练稀疏化方案,以减少大型语言模型的资源需求。通过将权重矩阵替换为较小的矩阵并减少嵌入维度,它可以在主要模型(如LLAMA2-70B和OPT 66B)中删除高达25%的模型参数,同时保留高达99%的...
Read MoreDeFlow是一种用于估计场景中三维运动的新方法,这是自动驾驶所必需的关键技能。它通过从基于体素的方法向基于点特征的方法过渡,并使用门控循环单元细化和引入新的损失函数,克服了传统体素化方法的局限性。
Read More研究人员开发出了一种新方法来创建场景图,使该过程更快速和高效。他们基于Transformer的技术专注于改进模型对图像中不同元素的理解和连接方式,从而提高了模型在挑战性任务上的性能。
Read More麻省理工学院的一个团队宣布了一种新的金属3D打印方法,该方法将打印速度和规模优先于分辨率。它能够以至少比可比金属添加制造过程快10倍的速度打印大型铝制品。该技术利用了一层100微米玻璃珠来创建一个结构,然后...
Read More