漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-02 talkingdev

微软推出面向初学者的生成型人工智能课程

微软在其广受欢迎的大型语言模型(LLMs)、向量数据库、提示技术以及低代码应用课程的基础上,发布了第二版的课程内容,现已上线GitHub。该课程共包含18课,虽然部分内容具有前瞻性,但依然是踏入该领域的良好起点。...

Read More
2024-04-02 talkingdev

LLMs如何引领RPA流程自动化新时代

尽管RPA(机器人流程自动化)在早期取得了一些成功,但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示,仅有3%的公司能够成功扩大其RPA项目规模。然而,人工智能的最新进展有望改变这一现状。大型语言...

Read More
2024-04-02 talkingdev

OpenChat Gemma 挑战调优难题,达到 Mistral 调优性能

OpenChat 团队的最新力作 Gemma,自推出以来便面临着调优的挑战。尽管困难重重,但 OpenChat 团队通过不懈努力,成功实现了与 Mistral 调优性能相匹配的成果。这一成就不仅展示了 OpenChat 团队的技术实力,也为未来...

Read More
2024-04-02 talkingdev

OpenUI-实现文本编辑到React、Svelte等界面的渲染

Wandb近日发布了一款名为OpenUI的创新工具包,该工具包允许用户通过文本描述来定义用户界面,并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑,简化了UI设计与开发的流程。...

Read More
2024-04-02 talkingdev

英伟达TensorRT更新,性能提升达28倍,Llama 2基准测试每秒处理1200个令牌

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新,这一更新使得AI推理速度大幅提高,达到了比基线快28倍的速度。特别是在Llama 2的基准测试中,能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

Read More
2024-04-02 talkingdev

论文:Total-Decom引领3D场景编辑新突破

Total-Decom技术通过从多视角图像中准确分解物体,以最小的用户努力实现3D场景重建,为用户提供了简便的编辑和操控体验。这一技术的出现,标志着3D场景编辑领域的一大进步,使得非专业人士也能轻松进行3D场景的创作...

Read More
2024-04-02 talkingdev

论文:Transformer-Lite,在手机GPU上运行大型语言模型

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段,成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

Read More
2024-04-02 talkingdev

论文:视觉语言模型遇到难题:新基准测试与改进方向

视觉语言模型(VLMs)在处理输入图像时,有时会遇到无法回答的问题。即便是最先进的VLMs,如GPT-4V,也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试,并探讨了一些可能的改进方向。研究者们通过...

Read More
  1. Prev Page
  2. 639
  3. 640
  4. 641
  5. Next Page