该仓库介绍了Wanda,一种通过选择性地丢弃不太重要的网络权重来减少大型语言模型复杂性的独特方法。与其他方法不同,Wanda无需重新训练或大量计算,能够在保持性能的同时实现有效的模型剪枝。
Read MoreClip2Protect项目引入了一种创新的两步方法,以确保面部隐私,特别是在强大的人脸识别系统的时代。它创建了看起来自然,但能欺骗人脸识别软件的'化妆'脸,相比之前的隐私增强方法,显示出更好的性能。
Read More800页的教程和150个示例笔记本构成了一份令人惊叹的资源,可以帮助人们学习实用的机器学习知识以及如何在金融应用中应用它。
Read More本研究调查了强大的语言模型是否能够教授较不先进的人工智能系统并提高其性能。研究提出了两个人工智能之间的“学生-教师”关系,并探讨了“教师”人工智能应该在什么时候、如何以及解释给“学生”人工智能,以提升其能力...
Read More**OmniEvent**是一个开源工具包,旨在提供全面的事件抽取解决方案,包括事件检测和参数提取过程。该工具包提供了针对不同范式的全面方法,对常用的英文和中文数据集进行公正和统一的评估。其模块化设计确保了高度可...
Read More近日,一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍,这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下,借助这个数据集和创新的...
Read More最近,研究人员在文本转图像(T2I)领域中推出了一种新的方法,称之为“无需提示的扩散”。这种系统只依靠视觉输入生成图像,无需任何文本提示。其利用了一种称为“语义上下文编码器(SeeCoder)”的独特结构来解释参考...
Read More利用预训练的图像-文本扩散模型和生成对抗网络(GAN)进行训练,作者提出了一种创新的方法来创建高质量、个性化的3D头像。通过使用这些先进的模型,我们可以创建各种风格的多视角头像图像,从而实现多样性。 ## 核...
Read More