本课程主要介绍如何在边缘设备上高效地进行低资源机器学习。课程包括讲座和作业。在这个课程中,我们将探讨在边缘设备上进行机器学习的技术,包括如何有效地使用有限的计算和存储资源,如何优化模型以适应边缘设备,...
Read More最新版本的Flash Attention在提升模型上下文长度和性能的同时,其速度也得到了极大的提升。目前,Flash Attention正在被HuggingFace生态系统本地化支持的过程中。Flash Attention的升级不仅仅提升了模型的运算速度,...
Read More这项研究探讨了如何使'学生'网络(较小的模型)在从未遇到过的情况下,更好地从'教师'网络(较大的模型)中学习。研究介绍了一种名为权重平均知识蒸馏(WAKD)的新方法,该方法的效果与现有技术一样好,但使用更为简...
Read More稳定扩散是一种复杂的技术,其可大幅度提高生成质量,而无需进行额外的训练。这是通过巧妙地调整权重和在UNet中扩大残差来实现的。具体的代码将在不久后公布。UNet是一种广泛应用于图像分割的深度学习框架,其独特的...
Read More近日,一个针对提升机器学习(ML)工程能力的深度资源在GitHub上获得了大量关注。这个资源提供了一系列详细的指南和建议,可以帮助工程师在机器学习领域提升技能水平。它包括了从基础理论到实际应用的各个方面,旨在...
Read MoreGoogle开发了一种名为OPRO(Optimization by PROmpting)的技术,通过人类风格的鼓励,如“让我们一步一步思考”,来提高LLMs的数学技能。这种方法实际上是在AI的计算过程中注入了人类的思维方式,使其在解决问题时更...
Read More丰田研究所(TRI)正在展示其在研究进展中如何在一夜之间教授机器人新技能。TRI运用传统的机器人学习技术和类似于生成AI模型的扩散模型。其系统已经针对60种技能进行了训练,主要关注在不同环境中的多功能性,目标是制...
Read MoreChatGPT,开放AI的对话机器人,近日进行了重要的更新。据公告,ChatGPT的训练截止日期已经从2021年9月升级到2022年1月。这意味着ChatGPT的学习和训练数据将包括更多的最近信息和知识。这个更新将使ChatGPT在处理最新...
Read More