Visual Autoregressive Models是一个新的GitHub项目,它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开,但目前该项目已经引起了技...
Read More当前神经网络在超出其训练数据的情况下泛化能力有限,这限制了它们的推理和可靠性。为了实现人工通用智能(AGI),我们需要寻找替代方法。专家认为,尽管深度学习和神经网络在特定任务上取得了显著成就,但它们距离...
Read MoreHugging Face 的 TGI 推理服务器曾短暂采用非商业性许可,试图阻止大型企业托管竞争版本。但这一策略并未带来更好的商业成果,反而削弱了社区参与度。现在,TGI 已经恢复到更为宽松的许可协议,以促进社区的共同发展...
Read MoreMLPerf 近日更新了其推理基准测试,新增了如 Llama 2 70B 和 Stable Diffusion XL 等大型语言模型,这一变化体现了整个行业对于大型生成型人工智能的转移。在最新测试中,Nvidia 的系统,尤其是搭载了 H200 处理器的...
Read MoreTGATE最新研究成果展示了一种高效的图像生成方法,该方法通过将整个生成过程分为规划和细化两个阶段来实现。这种新颖的方法不仅通过早期确定某些输出而简化了生成过程,而且还意外地提高了生成图像的质量。在规划阶...
Read MoreHumanity.tools(Tools for Humanity)为Worldcoin Orb开发了一个安全且强大的计算环境,该环境采用NVIDIA Jetson进行处理,并使用Arm Cortex M4微控制器执行实时功能。Orb运行Rust应用程序,并使用NVIDIA的TensorRT...
Read More英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...
Read More人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...
Read More近日,英伟达的GPU在MLPerf推理测试中取得了优异的成绩,尤其是H200型号。MLPerf推理测试是业界公认的深度学习性能评估基准,对AI系统的推理能力进行全方位评测。在此次测试中,英伟达的GPU展现了其在处理复杂机器学...
Read MoreAnyscale与NVIDIA最近宣布了一项新的合作伙伴关系,旨在帮助客户将生成式AI模型扩展到生产环境中。通过这次合作,客户可以将Ray与Anyscale的托管运行环境相结合,以提高资源管理、可观测性和自动扩缩容的能力。这项...
Read More