漫话开发者 - UWL.ME

2024-04-02 talkingdev

微软推出面向初学者的生成型人工智能课程

微软在其广受欢迎的大型语言模型（LLMs）、向量数据库、提示技术以及低代码应用课程的基础上，发布了第二版的课程内容，现已上线GitHub。该课程共包含18课，虽然部分内容具有前瞻性，但依然是踏入该领域的良好起点。...

2024-04-02 talkingdev

尽管RPA（机器人流程自动化）在早期取得了一些成功，但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示，仅有3%的公司能够成功扩大其RPA项目规模。然而，人工智能的最新进展有望改变这一现状。大型语言...

2024-04-02 talkingdev

OpenChat 团队的最新力作 Gemma，自推出以来便面临着调优的挑战。尽管困难重重，但 OpenChat 团队通过不懈努力，成功实现了与 Mistral 调优性能相匹配的成果。这一成就不仅展示了 OpenChat 团队的技术实力，也为未来...

2024-04-02 talkingdev

Wandb近日发布了一款名为OpenUI的创新工具包，该工具包允许用户通过文本描述来定义用户界面，并能够将其渲染到React、Svelte等多种流行的前端框架中。OpenUI的显著特点在于支持文本编辑，简化了UI设计与开发的流程。...

2024-04-02 talkingdev

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新，这一更新使得AI推理速度大幅提高，达到了比基线快28倍的速度。特别是在Llama 2的基准测试中，能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

2024-04-02 talkingdev

Total-Decom技术通过从多视角图像中准确分解物体，以最小的用户努力实现3D场景重建，为用户提供了简便的编辑和操控体验。这一技术的出现，标志着3D场景编辑领域的一大进步，使得非专业人士也能轻松进行3D场景的创作...

2024-04-02 talkingdev

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段，成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

2024-04-02 talkingdev

视觉语言模型（VLMs）在处理输入图像时，有时会遇到无法回答的问题。即便是最先进的VLMs，如GPT-4V，也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试，并探讨了一些可能的改进方向。研究者们通过...