2023年,AMD针对其图形处理单元(GPU)进行了优化,以增强其在大型语言模型(LLM)推理任务中的竞争力。这项优化涉及到硬件和软件层面的协同工作,使得AMD的GPU在处理复杂的机器学习任务时能提供更好的性能和效率。...
Read MoreCharacter AI是一家知名的人工智能公司,其每秒可处理20,000次查询,这一数据相当于Google搜索量的20%。为了能够高效运行,Character AI团队进行了一系列的创新性改进。这些改进不仅提高了系统的运行效率,还提升了...
Read More英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...
Read MorePuzzleVQA是一个专为测试大型多模态模型,如GPT-4V的抽象推理能力而设计的数据集。该数据集通过一系列复杂的视觉问题和答案对,评估模型在理解和推理方面的表现。这些问题往往需要模型进行深层次的逻辑思考和抽象概...
Read MoreAphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...
Read More虽然生成式人工智能(AI)的表现令人赞叹,但由于在推理类型上的根本概念限制,其智能水平尚未达到人类的水平。这不仅对当前的AI技术具有重要意义,同时也对于创造真正的人工通用智能(AGI)起到了决定性的作用。生...
Read More## 新闻概要: - Meta发布了一款专门用于AI推理工作负载的定制芯片。 - 这款7纳米芯片的功耗较低,与许多替代硬件相比速度相当。 - 尽管与其他科技巨头相比有些安静,但Meta的AI硬件计划仍在积极推进。 ## 详细内...
Read More