模型的相关内容 - 漫话开发者

2024-04-02 talkingdev

微软推出面向初学者的生成型人工智能课程

微软在其广受欢迎的大型语言模型（LLMs）、向量数据库、提示技术以及低代码应用课程的基础上，发布了第二版的课程内容，现已上线GitHub。该课程共包含18课，虽然部分内容具有前瞻性，但依然是踏入该领域的良好起点。...

2024-04-02 talkingdev

尽管RPA（机器人流程自动化）在早期取得了一些成功，但其在企业范围内的部署并没有达到预期效果。德勤的一项调查显示，仅有3%的公司能够成功扩大其RPA项目规模。然而，人工智能的最新进展有望改变这一现状。大型语言...

2024-04-02 talkingdev

英伟达在其GitHub仓库Optimum-Nvidia中发布了TensorRT的最新更新，这一更新使得AI推理速度大幅提高，达到了比基线快28倍的速度。特别是在Llama 2的基准测试中，能够达到每秒处理1200个令牌的惊人速度。这一进步得益...

2024-04-02 talkingdev

在移动设备上运行语言模型面临着延迟、带宽和功耗等多方面的挑战。本研究通过采用量化技术、移除键值缓存以及其他优化手段，成功实现了在手机上以每秒30个令牌的速度运行强大的Gemma 2B模型。这一成果比其他框架快约...

2024-04-02 talkingdev

视觉语言模型（VLMs）在处理输入图像时，有时会遇到无法回答的问题。即便是最先进的VLMs，如GPT-4V，也面临这一挑战。本文提出了一个针对VLMs在面对无解问题时的基准测试，并探讨了一些可能的改进方向。研究者们通过...

2024-04-01 talkingdev

近期，一项名为Qwen MoE的技术引起了业界关注。该技术在保持与强大7B参数模型相当性能的同时，成功将激活参数数量减少至原来的三分之一。这一突破性的进展不仅意味着更低的计算成本，还为大规模机器学习模型的可访问...

2024-04-01 talkingdev

在由大型模型系统组织运营的排行榜Chatbot Arena上，Anthropic公司的聊天机器人Claude 3 Opus首次超越了OpenAI的GPT-4。Chatbot Arena是一个开放模型的排行榜，它允许访问者对不同模型的输出进行评分，从而计算出综...

2024-04-01 talkingdev

EvoEval是一套全新的基准测试工具，专为评估大型语言模型（LLMs）的编码能力而设计。该测试套件采用了比以往更加严格的测试标准，以确保对LLMs编程能力的全面检测。EvoEval的发布意味着开发者和研究人员现在可以更准...