漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-11 talkingdev

GitHub仓库Chain-Of-Thought-Hub测试大型语言模型的复杂推理能力

### 核心要点: - GitHub仓库Chain-Of-Thought-Hub旨在通过链式思考提示来测试大型语言模型的复杂推理能力。 - 该仓库提供了一系列链式思考提示,旨在测试模型在推理和推断方面的表现。 - 这些测试可以帮助研究人员...

Read More
2023-05-10 talkingdev

人工智能语言模型Claude采用宪法AI方法进行训练

Anthropic公司采用宪法AI方法对其语言模型Claude进行训练,为其赋予了明确的价值观。这些价值观是根据一系列宪法原则确定的,包括联合国人权宣言等,而不是像RLHF输入那样由隐含的价值观决定。 ## 主要内容: - An...

Read More
2023-05-09 talkingdev

百万美元AI微调挑战赛

**内容简介:** - Kaggle的微调语言模型类比赛 - 通过社区的协力,提高语言模型的安全性 - 提供计算资源合作和奖励机制 - 比赛将于6月10日开始 **核心要点:** - Kaggle平台为微调语言模型提供了竞赛机会 - 通过...

Read More
2023-05-08 talkingdev

新技术发布:MosaicML发布具有更长“上下文”的语言模型

MosaicML最近发布了一种新的语言模型,可以处理多达65k个“词”的文本。这意味着该模型可以将整个小说《了不起的盖茨比》放入上下文中,并根据其写出一篇结尾。以下是该技术的三个核心要点: - 传统的语言模型只能在...

Read More
2023-05-05 talkingdev

技术新闻:VPGTrans技术可跨语言模型转移视觉提示生成器

最近,研究人员发现了一种更加便宜且节省时间的方法,用于创建新的视觉-语言AI模型。该方法名为VPGTrans,其可从现有模型中转移部分内容,大大加快了速度,使用的数据也更少,可以更轻松地创建强大的AI模型,而不...

Read More
2023-05-04 talkingdev

小模型备受欢迎,但能追赶上大模型吗?

在自然语言处理中,大型语言模型的推理能力往往比小型模型更强。这种推理能力有助于解决困难的任务,并可能使语言模型成为下一代计算平台/操作系统的基础。通过代码训练、思维链提示和强化学习等技术,可以提高模型...

Read More
2023-05-04 talkingdev

推出两门新的大语言模型和生成式AI在线课程

在这个数字化时代,人工智能正在成为一个不可或缺的话题。最近,两门关于大语言模型和生成式人工智能的在线公开课程(MOOC)已经推出。以下是该新闻的核心要点: - 推出两门新的在线公开课程,分别是大语言模型和生...

Read More
2023-05-03 talkingdev

GitHub 项目Jsonformer发布:更容易生成结构化JSON

内容摘要: - Jsonformer是一个基于HuggingFace模型的包装器,能够填充生成过程中的固定标记并将内容标记的生成委托给语言模型,从而生成符合指定模式的语法正确的JSON。 - Jsonformer目前仅支持JSON Schema的一部...

Read More
  1. Prev Page
  2. 156
  3. 157
  4. 158
  5. Next Page