漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-14 talkingdev

MMI智能:AI普及化的下一个趋势

群体混淆智能(MMI)的概念代表了从传统的单一AI扩展向基于分布式、基于代理的系统的模型的转变,这些系统可以实时学习和适应。MMI的理念根植于具体化、边界智能、时间性和个体性的原则,倡导强调具有一定自主性和相...

Read More
2024-02-14 talkingdev

Lag-Llama:基于Transformer的概率时间序列预测基础模型

Lag-Llama是一种基于Transformer的模型,可在零样本和少样本泛化方面表现出色,并在广泛的时间序列数据上进行了预训练。通过对少量数据进行微调,它超越了现有深度学习方法的最新性能,标志着时间序列分析基础模型的...

Read More
2024-02-14 talkingdev

深度强化学习的无人机控制策略训练库开源

最近,一家科技公司发布了一个训练端到端控制策略的代码库,用于使用深度强化学习训练无人机控制策略。该训练在模拟环境中进行,可以在消费级笔记本电脑上在几秒钟内完成。训练出的策略具有通用性,可以部署在真实的...

Read More
2024-02-14 talkingdev

论文:利用流体控制现实世界物体的强化学习实验系统

《流体盒子》介绍了一种新颖的实验系统,用于在动态的现实世界环境中测试强化学习算法,解决了模拟强化学习应用中复杂流体动力学的挑战。它展示了无模型强化学习算法从简单奖励中生成复杂行为的能力,并通过离线强化...

Read More
2024-02-13 talkingdev

Google研究:从人脑中读取音乐

Google最近发布了一段7分钟的视频,介绍了他们的Brain2Music项目,该项目旨在通过读取人脑信号来生成音乐。该项目使用深度学习技术来识别人脑中与音乐有关的信号,并将其转换为音乐的元素,如节拍、旋律和和弦。该技...

Read More
2024-02-13 talkingdev

RLX: 基于MLX的强化学习框架

RLX是一个基于MLX的强化学习框架,旨在为研究人员和工程师提供一个易于使用的平台,以便开发和实现强化学习算法。 RLX提供了一组易于使用的API和工具,可以帮助用户轻松地构建和训练强化学习模型。此外,RLX还提供了...

Read More
2024-02-13 talkingdev

高质量人类数据探讨

本文主要讨论人类在数据生成中的作用。人类可以收集偏好数据、进行注释标记等,以提高数据的质量。随着机器学习和人工智能的发展,高质量的人类数据越来越受到重视。本文还探讨了如何让人类数据更加准确、可靠,同时...

Read More
2024-02-13 talkingdev

强化学习算法的技能集优化

近期,将一种强化学习代理的技能转移到另一个代理上一直是一个挑战。但是,一项新的技术优化了一套可以在不同环境中使用的技能集,表现出很好的泛化性能。研究人员通过对一种基于技能的代理架构进行修改,将技能集的...

Read More
  1. Prev Page
  2. 90
  3. 91
  4. 92
  5. Next Page