人工智能的近期成就归功于三个主要因素:高效机器学习算法的创新、海量数据集的支持以及半导体技术的进步带来的能源高效计算。为了保持当前的发展速度,行业需要更为强大的设备。在过去的五十年中,行业一直专注于晶...
Read More近日,英伟达的GPU在MLPerf推理测试中取得了优异的成绩,尤其是H200型号。MLPerf推理测试是业界公认的深度学习性能评估基准,对AI系统的推理能力进行全方位评测。在此次测试中,英伟达的GPU展现了其在处理复杂机器学...
Read More随着新的模型不断涌现,声称在标准基准测试中达到了最先进的水平,衡量这些模型在特定任务和数据上的表现变得尤为重要。Superpipe是一个强大的工具,它能够帮助开发者构建自己的数据评估流水线。通过Superpipe,用户...
Read MoreOPTIN框架是一个创新的方法,用于提高基于变换器的AI模型在各个领域的效率,而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术,可以在特定约束下压缩网络,同时几乎不影响其准确性。通过这种方法,可以...
Read More语言模型(LLMs)的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...
Read More在RAG(检索-生成)管道中,对嵌入向量进行搜索是至关重要的一环。通过将fp32数字替换为单个0或1,并使用KNN聚类器和重排序器,可以在缩小内存需求30倍的同时,保持性能不受影响。这一技术突破为处理大规模数据集提...
Read More科技巨头Databrix与Mosaic合作,成功训练了一个具有132B参数的混合专家(MoE)模型。该模型在3000个H100 GPU上进行了训练,目前其权重文件已经公开发布。此外,该模型也已在Databricks API上提供服务,供企业和开发...
Read More近期,一个名为Salience DETR的项目引起了业界关注。该项目采用了层次化显著性过滤技术,对目标检测中的查询选择进行了优化。通过这种方式,Salience DETR在保持计算效率的同时,也提高了检测的准确性。这一技术的出...
Read MoreSegRefiner作为一种创新的模型无关解决方案,通过将细化过程视为数据生成过程,显著提升了各种分割任务中的对象掩膜质量。该技术通过离散扩散过程逐像素细化粗糙掩膜,从而提高分割和边界指标的精确度。这一方法的核...
Read More本文旨在帮助读者理解计算机的极限以及计算机无法完成的任务。大多数程序员似乎并不了解这些根本性的极限,以及它们的意义。了解图灵完备性及其对我们这些技术上不是图灵完备的有限机器的影响,对于编程来说至关重要...
Read More