深度强化学习的相关内容 - 漫话开发者

2025-12-08 talkingdev

开源|强化学习研究新视角：奖励机制应被视为智能体的一部分

近期，一项关于强化学习基础理论的讨论在技术社区引发关注。传统强化学习框架通常将奖励函数视为环境的一部分，但新的观点提出，奖励机制本质上应被理解为智能体自身的组成部分。这一范式转换意味着，奖励的“翻译”或...

2025-06-27 talkingdev

据最新报道，Meta已秘密招募OpenAI前强化学习专家Trapit Bansal加入其新成立的AI超级智能部门。这一动作虽未获官方确认，但业内人士分析指出，Bansal的加盟将显著提升Meta在前沿推理模型领域的研发能力。作为深度强...

2025-06-24 talkingdev

最新发表于arXiv的研究表明，通过在训练前随机剪除固定比例的权重参数，稀疏深度强化学习(DRL)网络展现出显著的参数效率优势。该方法不仅减少了模型复杂度，还成功规避了传统训练过程中常见的优化陷阱。这种一次性剪...

2025-03-11 talkingdev

近日，一个基于深度强化学习的轻量级避障系统在GitHub上发布，专为固定翼无人机（UAVs）设计。该系统结合了AirSim和JSBSim两大仿真平台，旨在提升无人机在高速飞行中的避障能力。通过深度强化学习算法，无人机能够在...

2024-08-15 talkingdev

最近，一位程序员使用JavaScript和AI算法，加上一罐WD-40喷剂，赢得了一个AI编程比赛的头奖。这位程序员说，他使用了一种名为'深度强化学习'的技术，来训练一个AI程序，使其自动完成一个特定的任务。然后，他使用Jav...

2024-03-04 talkingdev

Google DeepMind的Genie是一个基础的世界模型，通过在互联网视频上进行训练，可以从合成图像、照片甚至草图中生成各种可玩（动作可控）的环境。该模型使用了深度强化学习和生成式建模技术，可以为游戏开发、虚拟现实...

2024-02-29 talkingdev

来自加州大学圣地亚哥分校(UCSD)的研究人员训练了人形机器人的动作，使其更具表现力、社交倾向和鲁棒性。他们在草地上的非编排舞蹈视频非常令人印象深刻。该研究团队使用了深度强化学习，让机器人能够快速学习和适应...

2024-02-14 talkingdev

最近，一家科技公司发布了一个训练端到端控制策略的代码库，用于使用深度强化学习训练无人机控制策略。该训练在模拟环境中进行，可以在消费级笔记本电脑上在几秒钟内完成。训练出的策略具有通用性，可以部署在真实的...