Databricks Mosaic团队在语言模型训练领域不断创新。在最近的一篇文章中,他们讨论了用于fp8训练的训练技术栈,以及通过降低精度所带来的一些优势。fp8作为一种新兴的计算精度格式,能够在保持足够精度的同时,大幅...
Read More近期,微软对Inflection人才的收购再次激起了关于科技巨头公司在人工智能发展中控制过度的争论。虽然这些公司拥有的资源可以在核心语言模型上快速取得进展,但人们对于权力集中可能限制创新和透明度的担忧是有道理的...
Read MoreAdaIR(Adaptive Image Restoration)是一个全新的图像修复网络,通过频率挖掘和调制技术,有效应对图像噪声、模糊和雾霾等多种退化问题。该技术利用先进的算法,对图像中的不同退化因素进行精准识别和处理,从而实...
Read MoreMistral公司近期举办了一场黑客马拉松活动,并在此期间宣布了其7B语言模型的v0.2版本。同时,Mistral还发布了如何对其语言模型进行微调的代码。这些代码编写得整洁而简明,易于理解和使用。微调代码的发布,将有助于...
Read More最优传输理论是数学和计算领域的一个丰富分支,主要研究概率分布之间的距离。此GitHub仓库提供了一个全面的阅读清单,旨在提高最优传输在速度和准确性上的扩展性。该清单包括了最优传输理论的基础知识、数学原理、算...
Read More在最新的研究中,HETAL提出了一种新颖的迁移学习方法,该方法通过同态加密技术来确保数据隐私,这对于安全AI训练来说是一次重大的进步。同态加密允许在加密数据上直接进行计算,而无需解密,从而保护了数据的私密性...
Read More开放词汇注意力图谱(OVAM)是一种新兴的图像分割技术,它通过对类Stable Diffusion的文本到图像扩散模型进行改进,实现了对任意词汇生成注意力图的功能,打破了之前的限制。这意味着,通过OVAM,开发者和研究人员能...
Read More本文深入探讨了如何利用ChatGPT(或任何语言模型)为一个复杂任务编写不熟悉语言的代码。作者使用ChatGPT的代码解释器为流行的数据库SQLite编写、编译并下载新的绑定。这项技术不仅展示了ChatGPT在编程领域的潜力,...
Read More