漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-03 talkingdev

开源攻击事件时间线揭秘

近期,名为'Jia Tan'的攻击者实施了针对广泛使用的开源软件库xz的首次严重的供应链攻击。在攻击发生前,Jia Tan作为xz压缩库的一名贡献者,已经勤奋高效地工作了两年多。此次攻击事件引起了开源社区的广泛关注,对开...

Read More
2024-04-02 talkingdev

英伟达TensorRT更新,性能提升达28倍,Llama 2基准测试每秒处理1200个令牌

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

Read More
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-04-01 talkingdev

Airtable AI产品发布,将人工智能融入工作流程

Airtable公司近日推出了一款名为Airtable AI的新产品,旨在将人工智能技术直接整合到用户的日常工作流程中。这款产品通过简化AI集成过程,使得用户无需深入了解复杂的人工智能算法和编程语言,也能轻松地利用AI技术...

Read More
2024-04-01 talkingdev

Qwen MoE性能匹敌7B大模型,激活参数仅三分之一

近期,一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时,成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本,还为大规模机器学习模型的可访问...

Read More
2024-04-01 talkingdev

xAI发布新一代模型Grok 1.5,提升编程与检索能力

人工智能公司xAI近日宣布推出其最新模型Grok 1.5,该模型具有128k的上下文长度,能够更好地理解复杂的问题并提供准确的回答。Grok 1.5的推理能力得到了显著提升,尤其在信息检索和编程领域表现出色。这使得开发者和...

Read More
2024-03-29 talkingdev

MRA开源-高分辨率大型语言视觉助手

研究人员最近开发出一种名为Mixture-of-Resolution Adaptation(MRA)的新技术,该技术能够显著提升人工智能在图像识别中的细节识别能力。MRA方法通过调整AI模型对图像分辨率的适应度,使其更加精准地捕捉图像中的细...

Read More
2024-03-29 talkingdev

论文:CoDA技术助力AI模型无监督领域适应能力提升

CoDA作为一种新的无监督领域适应(UDA)方法,通过在场景和图像两个层面学习差异,帮助AI模型更好地适应未标记的、具有挑战性的环境。CoDA的核心在于利用大量未标记数据来训练模型,使其在面对新场景时仍能保持高效...

Read More
  1. Prev Page
  2. 114
  3. 115
  4. 116
  5. Next Page