FlashAttention是现代快速语言模型的基础,而最新的FlashAttention 3版本则是其重要的升级。与以前的版本相比,新版本使用了75%的H100容量(相比之前的35%有了显著的提升)。这次的能力提升归因于一系列重要的系统改...
Read MoreTinygrad是一款用于训练深度学习模型的工具包。这套笔记是AI编译器的极佳入门读物,更是为深入了解Tinygrad内部机制做好准备。Tinygrad以其精简的设计和高效的性能,为AI领域带来了新的可能性。无论你是AI领域的专家...
Read MoreMobileLLM 是一款新的技术工具,专为设备使用情景优化具有数亿参数的语言模型。这款工具的出现,将大大提高设备上语言模型的效率和性能。其优化能力强大,可以处理具有高达数十亿参数的语言模型,这对于需要在设备上...
Read More系统2模型是一种使用类似于思维链的方法,通过更多的测试时间计算来提升推理的模型。最新的研究发现,我们可以将这种行为提炼为一个系统1模型,使其运行速度更快,而准确性相似。系统1模型的主要优势在于其高效的运...
Read MoreDoti,一款由人工智能驱动的健康生活管理助手,近日正式发布。Doti的主要功能在于协助用户有效管理其健康和生活目标。通过使用先进的AI技术,Doti能深度学习用户的生活习惯和健康状况,然后提供个性化的建议和解决方...
Read MoreEleutherAI已为Llama 3 8B训练出新的SAEs,并发布了它们的权重和库代码。这一突破性的技术进步显示出EleutherAI对于研发和推动技术进步的强大能力。SAE的训练和优化是一项复杂的任务,需要大量的知识和专业技能。Ele...
Read MoreAriGraph是一种全新的方法,能够帮助AI Agent构建一个集成了语义记忆和事件记忆的记忆图谱。在此技术的帮助下,AI Agent可以更好地理解和处理各种复杂的情境,从而在各种任务中表现出更高的自主性和智能。此外,通过...
Read MoreGitHub Repo近日发布了一个名为“Quality Prompts”的全新库。这个库汇集了一系列不断增长的标准提示技巧,并能自动应用到你的提示中,以优化它们。这一库的发布,为开发者提供了更加高效、便捷的编程体验。无论是在日...
Read More