漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-16 talkingdev

OpenAssistant Conversations – 实现大型语言模型对齐的民主化[pdf]

新闻内容: OpenAI发表了一篇名为“OpenAssistant Conversations”的新论文,该论文探讨了使用大型语言模型来对齐对话的方法。这项技术可以帮助开发人员更轻松地构建聊天机器人和其他自然语言处理应用程序。以下是该...

Read More
2023-04-16 talkingdev

Web LLM - 利用WebGPU推动的大型语言模型推理

新闻内容: - Web LLM是一种基于WebGPU技术的大型语言模型推理方法 - 该技术可提高大型语言模型的推理速度和效率 - Web LLM有望应用于自然语言处理、机器翻译等领域,为人工智能技术的应用提供更为便利的解决方案

Read More
2023-04-16 talkingdev

打破记录!1T参数模型将使用33TB文本数据进行训练

新闻内容: - 研究人员正在使用33TB的文本数据训练一个1T参数模型,这是迄今为止最大的模型之一。 - 这个模型将用于自然语言处理,如语义理解和机器翻译,以提高模型的准确性和语义理解能力。 - 这项工作突破了以前...

Read More
2023-04-15 talkingdev

OpenAI 宣布暂不进行 GPT-5 的训练

OpenAI 的 Sam Altman 在最近的一次采访中表示,OpenAI 目前没有在进行 GPT-5 的训练,并且在一段时间内也不会进行。以下是本次采访中的三个核心观点: - OpenAI 目前没有在进行 GPT-5 的训练,这并不代表他们不会...

Read More
2023-04-15 talkingdev

深度解析Transformer模型及其工作原理

新闻内容: Transformer模型是一种深度学习模型,近年来在自然语言处理任务中表现出色。那么,它究竟是什么,又是怎么工作的呢?以下是本文的重点: - Transformer模型是什么 - Transformer模型的历史和发展...

Read More
2023-04-14 talkingdev

C-LoRA:解决文本到图像扩散模型中的“灾难性遗忘”问题

以下是新闻内容的核心要点: - 文本到图像扩散模型在定制化时面临“灾难性遗忘”的问题,导致过去概念的图像生成质量较差。 - 研究人员提出了 C-LoRA 方法,通过持续自我正则化低秩适应来克服这个问题,在持续扩散方...

Read More
2023-04-14 talkingdev

利用LLM构建应用程序

本篇文章主要介绍了Chip Huyen的一些见解,它是她长篇有用内容系列中的又一篇。具体而言,有两个见解-使用LLMs轻松构建出令人惊叹的应用程序,但将其准备好投入生产却异常困难。这主要是由于自然语言的歧义性以及如...

Read More
2023-04-13 talkingdev

ChatGPT多语言聊天

以下是本新闻的三个核心要点: - ChatGPT在37种语言和7种任务中的表现被评估,以更好地了解其多语言能力。 - 尽管ChatGPT在英语中表现出色,但在各种自然语言处理任务和语言中,其性能比以前的模型更差,凸显了在开...

Read More
  1. Prev Page
  2. 69
  3. 70
  4. 71
  5. Next Page