漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-14 talkingdev

构建和使用基于LLM的应用程序的我的思维模型

本文介绍了LLM的思维模型以及如何克服它们的局限性。了解LLM的思维模型是为了知道它们的适用范围,以及如何更好地使用它们。大多数人已经对谷歌有了类似的模型,但他们并没有意识到这一点——人们默认每个人都知道如何...

Read More
2023-11-14 talkingdev

开源GPTs:GitHub仓库OpenGPTs发布

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs,提示,超过100个工具,向量数据库,检索算法和聊天历史数据库。该项目使用LangChain,LangServe和LangSmith。OpenGPTs的...

Read More
2023-11-14 talkingdev

Nvidia推出AI计算猛兽H200 GPU,或加速ChatGPT

Nvidia推出了HGX H200 Tensor Core GPU,这是去年发布的H100 GPU的后续产品。H200采用Hopper架构来加速AI应用。它可能会导致更强大的AI模型和现有模型更快的响应时间。计算能力的缺乏一直是AI进步的主要瓶颈。亚马逊...

Read More
2023-11-13 talkingdev

VimGPT:使用 GPT-4V 和 Vimium 浏览互联网

由于互联网上的信息量越来越多,很多人都会疲于应对。现在,一种叫做 VimGPT 的新工具正在 GitHub 上流行。这个工具使用了 GPT-4V 和 Vimium,可以让用户更加快速、高效地浏览互联网。GPT-4V 是最新的 GPT 系列模型...

Read More
2023-11-13 talkingdev

OpenAI启动数据伙伴计划,与合作伙伴共同构建AI训练数据集

据外媒报道,OpenAI近日宣布启动数据伙伴计划,旨在与合作伙伴共同构建开放和私有的AI训练数据集。这个计划的启动也许意味着OpenAI即将用尽其下一轮模型训练的代币。OpenAI表示,他们需要大量的数据来训练AI模型,但...

Read More
2023-11-13 talkingdev

LM4Visual-基于AI文本模型来进行视觉任务

研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
2023-11-13 talkingdev

Intel与H100性价比对比:12分钟详解

MLPerf是一个标准的机器学习性能基准测试,可以准确显示平台和模型在实际环境中的表现。最新的MLPerf Training v3.1展示了H100在绝对性能方面的惊人表现,但在比较每花费一美元的时间性能时,Intel仍然占据着优势。

Read More
  1. Prev Page
  2. 338
  3. 339
  4. 340
  5. Next Page