漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-16 talkingdev

OpenAI与Meta计划推出具备更强推理能力的新AI模型

据报道,OpenAI和Meta正在准备推出新一代的人工智能模型,预计将具备更强的推理和规划能力。这些模型被称为GPT-5和Llama 3,目的是向人工通用智能迈进。然而,具体的发布时间线和应用细节尚不明确。鉴于过去AI领域过...

Read More
2024-04-12 talkingdev

JetMoe:性能媲美Meta Llama 2 7B的AI模型,成本仅为10万美元

JetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...

Read More
2024-04-10 talkingdev

Meta即将发布全新大型语言模型Llama 3

Meta公司近日确认,其最新一代大型语言模型Llama 3将于下月推出。Llama 3是Meta为其生成式人工智能助手而开发的先进技术,旨在提供更加精准、自然的对话体验。该模型经过深入的优化和升级,预计将为用户带来更加丰富...

Read More
2024-04-08 talkingdev

MLPerf 基准测试新增大型生成型AI模型,Nvidia 系统性能超群

MLPerf 近日更新了其推理基准测试,新增了如 Llama 2 70B 和 Stable Diffusion XL 等大型语言模型,这一变化体现了整个行业对于大型生成型人工智能的转移。在最新测试中,Nvidia 的系统,尤其是搭载了 H200 处理器的...

Read More
2024-04-02 talkingdev

OpenUI-实现文本编辑到React、Svelte等界面的渲染

Wandb近日发布了一款名为OpenUI的创新工具包,该工具包允许用户通过文本描述来定义用户界面,并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑,简化了UI设计与开发的流程。...

Read More
2024-04-02 talkingdev

英伟达TensorRT更新,性能提升达28倍,Llama 2基准测试每秒处理1200个令牌

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

Read More
2024-03-20 talkingdev

LlamaGym:在线强化学习优化大模型Agent

近日,GitHub上出现了一个新的项目LlamaGym,该项目专注于通过在线强化学习方法对大型语言模型(LLM)代理进行微调。大型语言模型在近年来取得了显著的进展,但如何进一步提升其性能,尤其是在特定任务上的表现,成...

Read More
2024-03-18 talkingdev

tlm-本地命令行补全助手开源

近期,一个名为tlm的本地命令行助手项目在GitHub上引起了开发者社区的关注。tlm是一个基于CodeLLaMa的本地代码自动补全工具,旨在提高开发者在命令行中的工作效率。通过利用CodeLLaMa的强大代码理解能力,tlm可以自...

Read More
2024-03-13 talkingdev

Meta发布24k H100s训练Llama 3细节

Meta在这篇博客文章中概述了用于训练Llama 3的基础设施。它介绍了存储、网络、Pytorch、NCCL等改进。这将为Meta今年其余时间上线的H100s打下基础。

Read More
2024-03-04 talkingdev

静态KV缓存实现HF推理速度2倍提升

如何加速推理是许多人关注的话题。本代码分享介绍了如何通过静态KV缓存提高Hugging Face框架上Llama模型的推理速度。

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page