这门关于大型语言模型的课程涵盖了数学、Python和神经网络的基本知识。它的重点是教授学生如何使用最新技术构建和部署最佳的LLMs。该存储库包含与LLMs相关的笔记本和文章列表以及进一步学习的资源。
Read More本文探讨了模型中存在几乎所有输入都会使用的热神经元和很少使用的冷神经元的想法。通过将热神经元预加载到GPU中,您可以节省内存而不会牺牲太多吞吐量。可以使用配套的代码库。
Read More苹果公司近日发布了两篇论文,介绍了新的三维头像和高效语言模型推断技术。这些技术的引入或将允许人工智能系统在iPhone和iPad上运行,极大提高智能设备的性能和用户体验。苹果的新技术为三维头像的生成提供了更为高...
Read More本文提供了一份长而广泛的调查,介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的,但可以用作学习有趣主题的跳板。在可能的情况下,它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...
Read More苹果公司和康奈尔大学的研究人员于10月份发布了一个名为Ferret的开源多模态LLM模型。Ferret是一个系统,可以在图像中的任何位置引用和定位任何东西,并以任何粒度进行查询。该模型可以检查图像上绘制的区域,确定其...
Read MoreOpenAI成立了一个新的安全咨询小组,并授权董事会对所有模型进行否决权。OpenAI是一个由伊隆·马斯克等人创建的人工智能研究组织,致力于通过开发先进的AI技术,推进人工智能的发展和应用。在新的安全咨询小组中,来...
Read MoreFacebook发布了一组工具、资源和示例,用于使用Llama模型系列。该工具集可帮助深度学习从业人员更高效地进行模型训练和应用。Llama模型系列由Facebook AI Research开发,已被广泛用于计算机视觉领域。这个工具集将包...
Read More