Open Hands团队最新发布的32B参数代码模型(Open Hands LM-32B)在强化学习(RL)训练框架下,基于Qwen架构实现了突破性进展。该模型在代理编码任务(agentic coding tasks)中的表现已超越许多参数规模更大的竞品,...
Read More近期,一项关于智能体任务时长能力的研究揭示了一个新的“摩尔定律”现象:智能体能够完成的任务长度每7个月翻倍。这一发现意味着,在未来的两年内,智能体将能够完成包含多个复杂步骤、时长达到数小时的任务。这一进...
Read MoreOWL(Optimized Workforce Learning Agent)是一个新兴的智能体框架,以其高效性和灵活性吸引了业界的广泛关注。该框架不仅在设计上体现出高度的合理性,而且在性能上也表现出色。OWL 允许开发人员通过简单的方式进...
Read MoreOpenAI近日发布了一系列新工具,包括API和智能体SDK,旨在帮助开发者更轻松地构建AI智能体。该工具包集成了网络和文件搜索功能、计算机使用能力以及可观察性工具,显著简化了智能体的编排和任务自动化流程。这些新工...
Read More近日,L-MAP技术在离线强化学习(Offline RL)领域取得了显著进展,特别是在处理随机、高维连续动作空间中的序列决策问题。L-MAP通过结合VQ-VAE模型,成功学习并优化了宏动作(macro-actions),从而显著提升了决策...
Read More近日,一项针对多目标强化学习(Multi-Objective Reinforcement Learning, MORL)的创新研究取得了重要进展。该研究提出了一种新型奖励降维方法,显著提升了学习效率,突破了传统方法的局限性。传统的多目标强化学习...
Read More同事Julius是一系列技术新闻中的主角,这些新闻围绕人工智能、机器学习和自然语言处理等前沿技术展开。Julius代表了现代技术的一个缩影,尤其在智能助手领域。智能助手技术借助于LLM(大型语言模型)、agent(智能代...
Read More近期研究聚焦于大型语言模型(LLM)代理之间的合作文化演进。在人工智能领域,LLM代理被设计为能够理解和生成自然语言的智能体。当这些代理被赋予合作任务时,它们展现出的互动和行为模式可以被视作一种文化进化现象...
Read More