漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-05 talkingdev

Brainformer:以效率换取简单性

近日,谷歌通过基因搜索算法和海量TPU的使用,开发出了一种新的模型——Brainformer,其收敛速度比传统的Transformer模型快5倍,推理速度快2倍。这种模型使用了MoE模块和一些其他巧妙的技巧,充分发挥了TPU的强大性能...

Read More
2023-06-05 talkingdev

开源项目:AWQ技术让大型AI模型更小更快

最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...

Read More
2023-06-02 talkingdev

自动化CEO:AI技术日益成熟,CEO变得越来越不必要

在这篇5分钟阅读的文章中,汉密尔顿·诺兰(Hamilton Nolan)认为,随着人工智能变得越来越成熟,CEO的角色正在变得越来越不必要。他认为我们应该将CEO职位自动化,并将CEO目前掌控的权力和财富分配给其他利益相关者,...

Read More
2023-06-02 talkingdev

加速MPT 65K上下文模型

最近MosaicML MPT模型仍然备受欢迎。其中一个重要的贡献是“Storywriter”模型,它可以在上下文中使用高达65k个标记。但是,使用这个模型进行推理非常缓慢。通过添加键/值缓存,我们可以将生成速度提高近10倍。 ## 内...

Read More
2023-06-02 talkingdev

智能GPT程序现已上线GitHub

--- 智能GPT程序是一款能够帮助LLMs使用插件完成复杂任务的程序,现已在GitHub上线。 ### 核心要点 - 智能GPT程序上线GitHub。 - 该程序可为LLMs提供插件来完成复杂任务。 - 这个程序可以提高LLMs的工作效率。

Read More
2023-06-02 talkingdev

GitHub推出GPT4Tools:控制视觉基础模型

近日,GitHub推出了GPT4Tools系统,该系统能够通过分析语言内容,管理多个视觉基础模型,使其能够根据用户在对话中的需求自动决定、控制和使用不同的模型。与众不同的是,它还可以通过简单的自我指导和LoRA方法,让...

Read More
2023-06-01 talkingdev

本地GPT:使用Vicuna-7B模型和InstructorEmbeddings实现离线问答

近日,开发者们在GitHub上发布了一个名为localGPT的Repo,该项目利用Vicuna-7B模型和InstructorEmbeddings实现了离线文档问答功能。以下是该项目的主要亮点: - 使用Vicuna-7B模型:该模型是由EleutherAI开发的巨型...

Read More
2023-06-01 talkingdev

Siit AI发布:基于GPT-4的内部知识库解答机器人

今天,Siit AI宣布了其基于GPT-4的内部知识库解答机器人的发布,该机器人可以通过Slack和Teams直接回答所有员工的问题。以下是这一发布的三个核心要点: - Siit AI是一种基于人工智能的机器人,能够立即回答所有员...

Read More
  1. Prev Page
  2. 305
  3. 306
  4. 307
  5. Next Page