在企业中,数据、评估和计算资源对于高性能的人工智能至关重要。评估(evals)可能是组织改进其AI产品的一个关键因素。通过构建针对商业问题的评估体系,企业能够更有效地衡量AI解决方案的性能,并据此进行优化。这...
Read More1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...
Read MoreValkey是一款高性能的数据结构服务器,主要用于键/值工作负载。它是流行Redis数据存储的开源分支。该项目始于Redis Labs(原Redis代码库背后的公司)将Redis更改为更具限制性的许可。Valkey分支已经汇聚了一批令人印...
Read More近日,英伟达的GPU在MLPerf推理测试中取得了优异的成绩,尤其是H200型号。MLPerf推理测试是业界公认的深度学习性能评估基准,对AI系统的推理能力进行全方位评测。在此次测试中,英伟达的GPU展现了其在处理复杂机器学...
Read MoreCerebras公司近日推出了其最新款的CS3晶圆芯片,该芯片具备训练高达24T参数语言模型的能力。CS3芯片的发布,标志着在人工智能领域对高性能计算芯片的需求得到了进一步的满足。这款芯片原生支持PyTorch,使得开发者能...
Read More由英特尔、谷歌、ARM、高通、三星等科技公司组成的统一加速(UXL)基金会,正在开发开源软件,旨在避免AI开发者受限于英伟达的专有技术。这一举措意味着,未来AI开发将有更多的选择,不必完全依赖英伟达的生态系统。...
Read MoreGarnet是一个远程缓存存储系统,具备卓越的性能、可扩展性、存储恢复能力、集群分片、键迁移和复制功能。该技术与现有的Redis客户端兼容,能够处理多键事务。Garnet拥有快速的可插拔网络设计,确保了端到端的高性能...
Read More在近日举行的英伟达年度GPU技术大会上,公司创始人兼首席执行官黄仁勋发表了主题演讲。本次演讲重点介绍了英伟达最新的技术进展和未来展望。黄仁勋强调了英伟达在人工智能、深度学习以及高性能计算等领域的领先地位...
Read MoreCo-LLM推出了一种新方法,可以让大型语言模型协作,逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务,从而在遵循指令、特定领域问题和推理挑战等方面提高性能。
Read More近日,研究人员提出了一种新的自动驾驶汽车高效模型——尖峰神经网络。该模型通过减少能耗高达85%,实现了高性能的目标。该模型在 GitHub 上建立了一个存储库,供研究人员和开发人员参考。据悉,尖峰神经网络结合了神...
Read More