MaxText是一个高性能、高可扩展性的开源低级机器学习模型(LLM),完全使用Python/Jax编写,目标是在Google Cloud的TPUs和GPUs上进行训练和推理。这个项目在GitHub上公开,充分展示了其强大的功能和优秀的性能。MaxTex...
Read More由于WebGPU标准的不断完善,现在可以在浏览器中进行高性能的GPU计算。最近,一组研究人员开发了一种基于WebGPU的算法,称为 'marching cubes',用于在浏览器中进行实时体积渲染。这项技术可以将三维图形数据转换为表...
Read MoreJEDEC(电子设备行业协会)已经发布了DDR5内存规格,其中包括DDR5-6400和DDR5-8400等速率级别,最高速率可达8800MT/S。同时,DDR5规格还增加了抗Rowhammer特性,这是一种攻击DDR内存的技术。DDR5内存将在未来几年内...
Read More在人工智能领域,神经网络是一种非常重要的模型。为了提高神经网络的性能,研究人员需要使用高效的工具来构建、编辑和可视化这些网络。近日,谷歌发布了名为Penzai的JAX研究工具包,旨在帮助研究人员更轻松地完成这...
Read MoreJetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...
Read MoreCohere公司近日推出了Command R+,这是一款专为企业级应用场景设计的高性能、可扩展的大型语言模型(LLM)。Command R+具备先进的检索增强生成功能,并支持引用,同时覆盖10种关键语言的多语言处理能力,以及工具使...
Read More近日,Groq公司的首席执行官宣布了一个重大战略转变,Groq将不再从事硬件销售业务,转而专注于提供AI云服务。这家曾以高性能硬件著称的科技公司,现在将精力集中在云计算和人工智能领域,旨在为客户提供更加先进的数...
Read MoreLambda公司近日宣布,已获得5亿美元的特别债务融资,用于扩大其GPU云服务。此前,Lambda在年初已经完成了2.3亿美元的C轮融资。该扩张计划预计将进一步增强Lambda在GPU云计算市场的影响力,为客户提供更加强大的计算...
Read More在企业中,数据、评估和计算资源对于高性能的人工智能至关重要。评估(evals)可能是组织改进其AI产品的一个关键因素。通过构建针对商业问题的评估体系,企业能够更有效地衡量AI解决方案的性能,并据此进行优化。这...
Read More1比特语言模型的研究为深度学习领域带来了新的突破。该技术通过在不损失性能的前提下,对语言模型中的线性层进行量化处理,实现了模型大小的大幅压缩。这一创新使得原本只能在高性能计算平台上运行的700亿参数模型,...
Read More