漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-12 talkingdev

Meta推出Pearl,生产级强化学习Agent库

Meta的应用强化学习团队推出了Pearl (GitHub Repo),这是一个生产级别的强化学习AI代理库。Pearl是一个Python库,它提供了各种强化学习算法,包括DQN、DDPG、TD3、SAC等等。Pearl还提供了基本的数据结构和一个可扩展...

Read More
2023-11-29 talkingdev

Berkeley的研究人员通过RLAIF提高Starling-7B模型的帮助性和无害性

伯克利的一组研究人员使用合成偏好数据训练了一个新的最先进的7B参数模型。本文讨论了训练奖励模型的新挑战(例如,示例在列表中的位置会改变其排名)以及他们如何克服这些挑战。结果模型可与经过训练的奖励模型一起...

Read More
2023-11-28 talkingdev

RLHF的替代方案,DPO实现方案开源

直接偏好优化是使用非常相似的数据的RLHF的稳定替代方法。该存储库包含一个实现,用于学习该技术。虽然DPO是一种新兴的技术,但它在许多情况下都能够提供比强化学习更好的结果。它非常适合解决一些现实世界中的问题...

Read More
2023-11-16 talkingdev

Serverless无服务器数据系统的架构

云数据服务的未来是大规模和多租户的。本文介绍了现实世界中无服务器多租户(MT)数据架构,以了解不同类型的系统如何实现无服务器MT。虽然一些模式立即跳出来,但是调查的系统之间有惊人的多样性。本文涵盖了什么是...

Read More
2023-11-15 talkingdev

Xbox与Inworld AI合作开发生成式AI工具,助力游戏开发

Xbox和Inworld AI正在合作开发基于人工智能的工具,以帮助丰富游戏开发中的叙事和角色创作元素。合作将开发一个AI设计副驾驶员,以协助游戏设计师,并开发一个AI角色运行时引擎,提供沉浸式的游戏体验。他们预计这些...

Read More
2023-11-08 talkingdev

Xbox携手Inworld AI开发AI工具以推动游戏开发创新

微软的Xbox与Inworld AI合作,提供AI驱动的游戏开发工具,聚焦于叙事和角色创造,以促进和丰富游戏设计流程。Inworld AI的自然语言生成技术将被应用于游戏开发中,以帮助设计师更快地构建角色和编写对话。这种技术将...

Read More
2023-11-02 talkingdev

AI技术助力SEO优化:关键词生成器推出

近日,一款基于人工智能技术的关键词生成器正式推出。该产品可以自动分析网站内容,并根据内容特点生成最优化的关键词,为网站SEO优化提供帮助。据悉,该产品适用于各类网站类型,包括企业官网、电商平台等。用户只...

Read More
2023-10-31 talkingdev

FlowRL推出基于AI技术的实时UI个性化产品

FlowRL是一家专注于人工智能技术的创新公司,日前推出了其最新产品FlowRL,该产品提供了一种基于AI技术的实时UI个性化解决方案。通过该产品,用户能够根据用户行为和偏好,对UI界面进行实时个性化,提升用户体验和转...

Read More
2023-10-31 talkingdev

HF团队成功复现OpenAI的第一个RLHF代码库

HuggingFace团队成功复现了OpenAI的第一个RLHF代码库,该代码库于2019年发布,是引入了一些最初的RLHF(强化学习与人类因素)想法。这个代码库被称为“Generative Pretraining Transformer(GPT)”。通过在计算机上训...

Read More
2023-10-26 talkingdev

RLMRec-将LLMs应用于推荐系统可提升推荐质量

该项目介绍了RLMRec,一个将LLMs与推荐系统相结合的框架,捕捉用户行为和偏好的更深层含义,提高推荐的质量。

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page