漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-27 talkingdev

Meta挖角OpenAI强化学习先驱,加速超级智能研发

据最新报道,Meta已秘密招募OpenAI前强化学习专家Trapit Bansal加入其新成立的AI超级智能部门。这一动作虽未获官方确认,但业内人士分析指出,Bansal的加盟将显著提升Meta在前沿推理模型领域的研发能力。作为深度强...

Read More
2025-06-24 talkingdev

[论文推荐]稀疏DRL网络通过预训练随机剪枝实现参数高效优化

最新发表于arXiv的研究表明,通过在训练前随机剪除固定比例的权重参数,稀疏深度强化学习(DRL)网络展现出显著的参数效率优势。该方法不仅减少了模型复杂度,还成功规避了传统训练过程中常见的优化陷阱。这种一次性剪...

Read More
2025-03-11 talkingdev

无人机避障新突破:基于深度强化学习的轻量级系统发布

近日,一个基于深度强化学习的轻量级避障系统在GitHub上发布,专为固定翼无人机(UAVs)设计。该系统结合了AirSim和JSBSim两大仿真平台,旨在提升无人机在高速飞行中的避障能力。通过深度强化学习算法,无人机能够在...

Read More
2024-08-15 talkingdev

如何使用JavaScript、AI和一罐WD-40赢得了$2,750的奖金

最近,一位程序员使用JavaScript和AI算法,加上一罐WD-40喷剂,赢得了一个AI编程比赛的头奖。这位程序员说,他使用了一种名为'深度强化学习'的技术,来训练一个AI程序,使其自动完成一个特定的任务。然后,他使用Jav...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
2024-02-29 talkingdev

UCSD-训练更具表现力的人形机器人

来自加州大学圣地亚哥分校(UCSD)的研究人员训练了人形机器人的动作,使其更具表现力、社交倾向和鲁棒性。他们在草地上的非编排舞蹈视频非常令人印象深刻。该研究团队使用了深度强化学习,让机器人能够快速学习和适应...

Read More
2024-02-14 talkingdev

深度强化学习的无人机控制策略训练库开源

最近,一家科技公司发布了一个训练端到端控制策略的代码库,用于使用深度强化学习训练无人机控制策略。该训练在模拟环境中进行,可以在消费级笔记本电脑上在几秒钟内完成。训练出的策略具有通用性,可以部署在真实的...

Read More
2024-01-25 talkingdev

开源RPG框架,改进文本到图像生成质量

最近,由阿里达摩院、南京邮电大学、南京大学等机构合作开发的RPG框架在GitHub上开源。该框架采用“Recaption、Plan和Generate”的方法来改进文本到图像生成,将复杂的图像创建任务分解为更简单的任务,从而在处理多个...

Read More
  1. Next Page