漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-13 talkingdev

打造自己的Llama 2,取代GPT-3.5/4

人工智能领域的新闻总是让人振奋人心,最近有关Llama 2的消息开始引起了人们的关注。Llama 2是由OpenAI推出,这是一款新的人工智能模型,用于自然语言处理。Llama 2被称为是GPT-3.5/4的替代品,因为它可以在大多数任...

Read More
2023-09-12 talkingdev

构建基于LLM系统与产品的七大实用模式

本文分享了七种实用模式,用于将大型语言模型(LLM)整合到系统中:性能测量、添加最新知识、微调任务、缓存以节省时间/成本、确保质量输出、错误管理以及利用用户反馈。首先,性能测量是衡量模型在实际应用中的效果...

Read More
2023-09-12 talkingdev

大型语言模型能否具备推理能力?

大型语言模型(LLMs)是否具备人类般的推理能力的争论仍在进行中。一方面,有些研究显示,这些模型主要依赖于记忆和模式匹配。另一方面,也有研究显示,它们在与训练数据相关的任务中表现出色,显示出一定的推理能力...

Read More
2023-09-12 talkingdev

论文:更好理解和推理图片的新方法研究

本研究的作者们已经创建了一种方法,用以测试视觉语言模型对于他们所看到的内容进行逻辑思考的能力。视觉语言模型是一种结合了计算机视觉和自然语言处理的技术,它能理解和解释图片中的内容。然而,这种模型在理解和...

Read More
2023-09-12 talkingdev

无需草稿模型,加速推测解码的新方法

语言模型推理通常较慢,因为这些模型的运行严重依赖内存。为了解决这一问题,人们引入了使用较小的草稿模型进行推测性解码,以“提前”提供给大模型的建议。这种方法效果不错,但实现起来复杂,且寻找一个好的草稿模型...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-09-12 talkingdev

RestGPT:基于LLM的自主控制Agent

RestGPT是一款旨在构建基于大型语言模型的自主控制实体的新型语言模型,其主要应用领域包括电影数据库和音乐播放器等实际应用。此模型采用先进的自然语言处理技术,将人类语言输入转化为计算机可以理解和执行的命令...

Read More
2023-09-12 talkingdev

为什么Nvidia在人工智能领域的霸主地位只是暂时的

Nvidia在人工智能领域的领先地位远非稳固。它目前的优势主要是因为几乎没有人在运行大型机器学习应用程序,竞争对手还没有成熟,研究人员拥有购买力,以及关注于模型训练方面。但在不久的将来,使用CPU进行推理将会...

Read More
  1. Prev Page
  2. 367
  3. 368
  4. 369
  5. Next Page