漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-13 talkingdev

Wombat:从RLHF到RRHF,以“正确”的方式对齐人类喜好(GitHub代码库)

## 新闻内容: Wombat是一种新的RLHF(Reinforcement Learning with Human Feedback,即通过人类反馈进行强化学习)学习范式,它通过更高效地将语言模型输出与人类喜好对齐,在需要更少的模型的情况下提供了简单的P...

Read More
2023-04-12 talkingdev

特斯拉CEO马斯克在Twitter的生成式AI项目中进行大规模投资

特斯拉CEO马斯克据报道正在Twitter内推进一个人工智能项目,他最近为该平台购买了约1万个图形处理器。马斯克还雇用了两名来自DeepMind的前工程师参与该项目。该项目涉及一个大型的语言模型,但仍处于早期阶段。马斯...

Read More
2023-04-11 talkingdev

语言模型转化为代理人:AI新范式

本篇报道介绍了一项关于语言模型模拟整个城镇的研究。研究发现,如果让语言模型完成开放式任务,它们可以展现出惊人的类人社交能力,如保持日程安排、计划活动、回忆先前的互动,甚至在情人节相互邀约。这是语言模型...

Read More
  1. Prev Page
  2. 158
  3. 159
  4. 160