漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-17 talkingdev

首个RNN在Transformers库中发布

近日,基于线性注意力模型与内置循环的RWKV模型成为Transformers库中首个推出的RNN模型。该模型是一个强大的语言模型,理论上可运行较长的上下文窗口,并具有快速的运行速度。目前,该模型在HuggingFace平台上的开发...

Read More
2023-05-16 talkingdev

亚马逊计划引入 ChatGPT 搜索功能

亚马逊计划将 ChatGPT 风格的产品搜索功能引入其网店,这将与微软和谷歌将生成式人工智能融入其搜索引擎的努力相提并论。 ## 新闻要点: - 亚马逊计划将 ChatGPT 风格的产品搜索引入其网店。 - 这将使亚马逊与微软...

Read More
2023-05-11 talkingdev

GitHub仓库Chain-Of-Thought-Hub测试大型语言模型的复杂推理能力

### 核心要点: - GitHub仓库Chain-Of-Thought-Hub旨在通过链式思考提示来测试大型语言模型的复杂推理能力。 - 该仓库提供了一系列链式思考提示,旨在测试模型在推理和推断方面的表现。 - 这些测试可以帮助研究人员...

Read More
2023-05-08 talkingdev

Otter模型推出新方法MIMIC-IT,改善AI系统的指令理解能力(GitHub代码库)

研究人员推出了一种新的方法,称为MIMIC-IT,用于改善像Otter这样的模型在不同情境下(包括图像和文本)理解和遵循指令的能力。通过使这些模型更易于使用,研究人员可以更轻松地创建更好的AI系统。 ### 核心要点 -...

Read More
2023-05-08 talkingdev

利用图神经网络模型处理长篇文本

近日,来自加拿大滑铁卢大学的研究人员提出了一种新的处理长篇文本的方法。他们利用图神经网络和新的注意力机制,以便更好地理解句子之间的关系,从而提高了自然语言处理模型的性能。 该研究的核心内容包括: - 长...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

谷歌停止分享 AI 研究成果

谷歌因 ChatGPT 的发布,要求其 AI 研究人员停止在产品发布之前公开其研究,这一决定将对 AI 界造成影响。 ## 新闻摘要 谷歌已经下令其 AI 研究人员停止在产品发布之前发布研究。此决定是因为谷歌最近推出了 ChatG...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
  1. Prev Page
  2. 67
  3. 68
  4. 69
  5. Next Page