这项研究介绍了一种使用降阶建模压缩大型语言模型的方法,可以显著减少内存和时间限制,而无需高端硬件。由于大型语言模型在自然语言处理中的应用越来越广泛,因此压缩这些模型以提高计算效率变得尤为重要。研究人员...
Read More谷歌宣布推出Cloud TPU v5p,这是目前谷歌最强大、可扩展和灵活的AI加速器。TPU用于训练和提供AI产品。谷歌还宣布推出AI超级计算机,这是一种超级计算机架构,采用性能优化硬件、开放软件、领先的ML框架和灵活的消费...
Read MoreStable Fast是HuggingFace扩散模型的推理引擎,通过它可以进行快速的Diffusers推理。该推理引擎在多种硬件上实现了出色的性能,包括CPU和GPU。此外,Stable Fast还兼容多个框架,包括PyTorch和TensorFlow。在GitHub...
Read MoreIBM和Meta领导的AI联盟,汇聚了50多个全球组织,旨在促进开放、负责任的AI发展。它的重点是制定AI标准、推进硬件发展、促进AI教育和技能。成员包括主要的技术公司、大学和研究机构。该联盟强调安全、多样性和平等获...
Read MoreNous Research发布了Hermes 2.5视觉模型,该模型基于最佳的7B语言模型和SigLIP集成,是一种强大的新型开源文本和视觉模型,可在消费级硬件上运行。这里的一个很酷的创新是集成函数调用。由于存在幻觉问题,该模型仍...
Read More近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...
Read More该团队创建了一个新的面向视觉的RISC-V硬件,并训练了一个超小的YOLO计算机视觉模型,实现了低功耗和极低延迟的实时物体检测。该技术可广泛应用于智能眼镜、自动驾驶、智能家居等领域。
Read More您需要更多的计算能力(和选择)来微调您的生成式人工智能吗?使用实践教程和实际代码样例学习✔️。通过不同的硬件配置评估性能和加速度✔️。构建异构应用程序,开发自己的原型,并对AI工作负载进行基准测试。从免费层开...
Read More稀疏张量是指神经网络的某些值为零。这些值可以被高效地跳过。研究人员开发了一种快速查找零值的方法,并超负荷硬件,以便一次容纳更多的非零值。
Read More2023年,人工智能和开源技术领域经历了许多重大发展。从人工智能的硬件和软件创新,到开源技术的社区合作和开放性,这些发展推动了行业的不断进步。在硬件方面,各大公司都在竞相研发新一代的芯片,以应对人工智能应...
Read More