漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-08 talkingdev

Otter模型推出新方法MIMIC-IT,改善AI系统的指令理解能力(GitHub代码库)

研究人员推出了一种新的方法,称为MIMIC-IT,用于改善像Otter这样的模型在不同情境下(包括图像和文本)理解和遵循指令的能力。通过使这些模型更易于使用,研究人员可以更轻松地创建更好的AI系统。 ### 核心要点 -...

Read More
2023-05-08 talkingdev

利用图神经网络模型处理长篇文本

近日,来自加拿大滑铁卢大学的研究人员提出了一种新的处理长篇文本的方法。他们利用图神经网络和新的注意力机制,以便更好地理解句子之间的关系,从而提高了自然语言处理模型的性能。 该研究的核心内容包括: - 长...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

谷歌停止分享 AI 研究成果

谷歌因 ChatGPT 的发布,要求其 AI 研究人员停止在产品发布之前公开其研究,这一决定将对 AI 界造成影响。 ## 新闻摘要 谷歌已经下令其 AI 研究人员停止在产品发布之前发布研究。此决定是因为谷歌最近推出了 ChatG...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
2023-05-04 talkingdev

Chat Chat:打造更丰富的 AI 对话体验

多个 API 的结合,让 AI 对话体验更加丰富。GitHub 上的 Chat Chat 项目,为你提供了来自 OpenAI、Microsoft Azure、Claude、Cohere、Hugging Face 等多种 API,让你的 AI 对话体验更加自然、智能。 ## 项目亮点:...

Read More
2023-05-04 talkingdev

新技术:Unlimiformer可以轻松处理超长文本

Unlimiformer是一种新的方法,可以与任何基于transformer的模型配合使用,使其能够处理超长的输入文本,而不会出现限制。这种酷炫的技术可以改善BART和Longformer等模型,使它们能够对超长文本进行概括,甚至是整本...

Read More
2023-05-04 talkingdev

小模型备受欢迎,但能追赶上大模型吗?

自然语言处理中,大型语言模型的推理能力往往比小型模型更强。这种推理能力有助于解决困难的任务,并可能使语言模型成为下一代计算平台/操作系统的基础。通过代码训练、思维链提示和强化学习等技术,可以提高模型...

Read More
  1. Prev Page
  2. 63
  3. 64
  4. 65
  5. Next Page