这项研究介绍了AV-SUPERB,这是一个新的基准测试,用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展,并为未来的研究提供一个统一的平台。这项研究突出了模...
Read MoreMLPerf发布了两个基准测试套件的结果:MLPerf Inference v3.1和MLPerf Storage v0.5。前者显示了创纪录的参与度和性能提升,后者评估了机器学习训练工作负载的存储系统性能。推理基准测试套件引入了一个大型语言模型...
Read More最近,MLCommons推出了一项新的基准测试,用于评估顶级硬件运行AI模型的速度。在这次的评估中,Nvidia和Intel分别获得了第一和第二的位置。这项测试的发布,不仅为科技界提供了一个公平、公正的评估标准,也为消费者...
Read More在持续推动成为AI领域的开源贡献者的过程中,Meta公司近日公布了他们的DINO v2模型,并采用了更为宽松的许可证,允许社区在其基础上进行构建。此外,他们还发布了一个数据集,有助于确定并对各种计算机视觉模型中的...
Read More拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...
Read More自动视频生成作为一个新兴的研究领域,已经引起了广泛的关注。其中,故事延续、故事混搭等任务的衡量标准十分复杂。谷歌最新推出的视频生成基准测试工具,希望能帮助这一领域取得进一步的进展。通过这个基准测试,研...
Read More近期的模型常常在处理复杂的视觉-语言任务上遇到困难,这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务,研究人员引入了I4基准。结果显示,视觉提示生成器的注意力存在缺陷。为了解决这个...
Read More近日,一份评估人工智能(AI)进展的跨领域报告引起了业内的广泛关注。这份报告由一个专门预测各类结果的团队发布,详细分析了各类AI模型在各种基准测试中的表现。报告显示,一些前沿的AI模型在预测任务中表现出色,成...
Read More