漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
2023-05-04 talkingdev

小模型备受欢迎,但能追赶上大模型吗?

在自然语言处理中,大型语言模型的推理能力往往比小型模型更强。这种推理能力有助于解决困难的任务,并可能使语言模型成为下一代计算平台/操作系统的基础。通过代码训练、思维链提示和强化学习等技术,可以提高模型...

Read More
2023-05-04 talkingdev

推出两门新的大语言模型和生成式AI在线课程

在这个数字化时代,人工智能正在成为一个不可或缺的话题。最近,两门关于大语言模型和生成式人工智能的在线公开课程(MOOC)已经推出。以下是该新闻的核心要点: - 推出两门新的在线公开课程,分别是大语言模型和生...

Read More
2023-05-03 talkingdev

GitHub 项目Jsonformer发布:更容易生成结构化JSON

内容摘要: - Jsonformer是一个基于HuggingFace模型的包装器,能够填充生成过程中的固定标记并将内容标记的生成委托给语言模型,从而生成符合指定模式的语法正确的JSON。 - Jsonformer目前仅支持JSON Schema的一部...

Read More
2023-05-03 talkingdev

微软计划推出高价私有化ChatGPT服务,企业用户可享数据隐私保护

据报道,微软计划向关注数据泄露和合规性的企业用户提供一个隐私关注的ChatGPT版本。该产品将在专用服务器上运行ChatGPT,并保护敏感数据不被用于训练语言模型。它的价格可能是目前使用ChatGPT客户支付费用的10倍。O...

Read More
2023-05-03 talkingdev

GPT能记住哪些书?

最近有人说,现今的大型语言模型“已经看遍整个互联网”。这并不完全正确,但它们确实看过许多不同的书。而且结果表明,它们已经记住了许多这些书的内容。这篇有趣的论文试图通过一些巧妙的实验来找出它们记住了哪些书...

Read More
2023-05-03 talkingdev

GPT四家教控制现已发布

GitHub上发布了GPT四家教控制的仓库,这个仓库可以让你的语言模型变成一个家教,从而帮助你更好地学习。以下是该教程的主要内容: - GPT四家教控制是一个基于DAN破解的聊天bot,它可以根据提示变成家教角色; - Mr....

Read More
  1. Prev Page
  2. 163
  3. 164
  4. 165
  5. Next Page