漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

谷歌停止分享 AI 研究成果

谷歌因 ChatGPT 的发布,要求其 AI 研究人员停止在产品发布之前公开其研究,这一决定将对 AI 界造成影响。 ## 新闻摘要 谷歌已经下令其 AI 研究人员停止在产品发布之前发布研究。此决定是因为谷歌最近推出了 ChatG...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
2023-05-04 talkingdev

Chat Chat:打造更丰富的 AI 对话体验

多个 API 的结合,让 AI 对话体验更加丰富。GitHub 上的 Chat Chat 项目,为你提供了来自 OpenAI、Microsoft Azure、Claude、Cohere、Hugging Face 等多种 API,让你的 AI 对话体验更加自然、智能。 ## 项目亮点:...

Read More
2023-05-04 talkingdev

新技术:Unlimiformer可以轻松处理超长文本

Unlimiformer是一种新的方法,可以与任何基于transformer的模型配合使用,使其能够处理超长的输入文本,而不会出现限制。这种酷炫的技术可以改善BART和Longformer等模型,使它们能够对超长文本进行概括,甚至是整本...

Read More
2023-05-04 talkingdev

小模型备受欢迎,但能追赶上大模型吗?

自然语言处理中,大型语言模型的推理能力往往比小型模型更强。这种推理能力有助于解决困难的任务,并可能使语言模型成为下一代计算平台/操作系统的基础。通过代码训练、思维链提示和强化学习等技术,可以提高模型...

Read More
2023-05-03 talkingdev

GPT能记住哪些书?

最近有人说,现今的大型语言模型“已经看遍整个互联网”。这并不完全正确,但它们确实看过许多不同的书。而且结果表明,它们已经记住了许多这些书的内容。这篇有趣的论文试图通过一些巧妙的实验来找出它们记住了哪些书...

Read More
2023-04-26 talkingdev

深度学习的非技术解释

新闻内容: - 深度学习是一种人工智能技术,可以通过模拟人脑神经网络的方式进行学习和决策。 - 深度学习的应用范围非常广泛,包括图像识别、语音识别、自然语言处理等领域。 - 深度学习的核心是神经网络,通过不断...

Read More
  1. Prev Page
  2. 49
  3. 50
  4. 51
  5. Next Page