AI模型的训练数据质量对于获得良好性能非常重要。在代码模型中,数据去重往往非常重要。对于文本而言,目前尚不清楚它是否同样重要。然而,无论如何,本博客介绍了用于去重文本样式数据的技术。
Read MoreGato于一年前发布,立即成为热门话题。建立在Gato之上的RoboCat是一个具有语言能力的机器人系统,可以在不到100个步骤中学习新任务。这似乎是语言能力机器人领域迈出的一大步。
Read MoreClip2Protect项目引入了一种创新的两步方法,以确保面部隐私,特别是在强大的人脸识别系统的时代。它创建了看起来自然,但能欺骗人脸识别软件的'化妆'脸,相比之前的隐私增强方法,显示出更好的性能。
Read More这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...
Read More这篇文章由a16z撰写,讨论了一些新兴的LLM应用架构,包括联邦学习、边缘计算和无服务器计算。这些架构为LLM提供了新的扩展方式和更高效的运行方式,可能会在未来推动LLM的广泛应用。
Read More