漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-02 talkingdev

Open Hands推出32B代码模型,在代理编码任务中超越更大规模模型

Open Hands团队最新发布的32B参数代码模型(Open Hands LM-32B)在强化学习(RL)训练框架下,基于Qwen架构实现了突破性进展。该模型在代理编码任务(agentic coding tasks)中的表现已超越许多参数规模更大的竞品,...

Read More
2025-03-20 talkingdev

[论文推荐]AI完成长任务能力的“摩尔定律”:任务时长每7个月翻倍

近期,一项关于智能体任务时长能力的研究揭示了一个新的“摩尔定律”现象:智能体能够完成的任务长度每7个月翻倍。这一发现意味着,在未来的两年内,智能体将能够完成包含多个复杂步骤、时长达到数小时的任务。这一进...

Read More
2025-03-17 talkingdev

[开源] 优化的工作学习代理框架OWL:高效且灵活的智能体构建方案

OWL(Optimized Workforce Learning Agent)是一个新兴的智能体框架,以其高效性和灵活性吸引了业界的广泛关注。该框架不仅在设计上体现出高度的合理性,而且在性能上也表现出色。OWL 允许开发人员通过简单的方式进...

Read More
2025-03-12 talkingdev

OpenAI推出全新AI智能体构建工具包

OpenAI近日发布了一系列新工具,包括API和智能体SDK,旨在帮助开发者更轻松地构建AI智能体。该工具包集成了网络和文件搜索功能、计算机使用能力以及可观察性工具,显著简化了智能体的编排和任务自动化流程。这些新工...

Read More
2025-03-05 talkingdev

L-MAP技术革新:提升离线强化学习中的序列决策能力

近日,L-MAP技术在离线强化学习(Offline RL)领域取得了显著进展,特别是在处理随机、高维连续动作空间中的序列决策问题。L-MAP通过结合VQ-VAE模型,成功学习并优化了宏动作(macro-actions),从而显著提升了决策...

Read More
2025-03-05 talkingdev

多目标强化学习效率提升:新型奖励降维方法突破传统限制

近日,一项针对多目标强化学习(Multi-Objective Reinforcement Learning, MORL)的创新研究取得了重要进展。该研究提出了一种新型奖励降维方法,显著提升了学习效率,突破了传统方法的局限性。传统的多目标强化学习...

Read More
2024-12-24 talkingdev

探索未来:同事Julius的智能体助手技术

同事Julius是一系列技术新闻中的主角,这些新闻围绕人工智能、机器学习和自然语言处理等前沿技术展开。Julius代表了现代技术的一个缩影,尤其在智能助手领域。智能助手技术借助于LLM(大型语言模型)、agent(智能代...

Read More
2024-12-19 talkingdev

论文:深度解析LLM Agent间的合作文化演进

近期研究聚焦于大型语言模型(LLM)代理之间的合作文化演进。在人工智能领域,LLM代理被设计为能够理解和生成自然语言的智能体。当这些代理被赋予合作任务时,它们展现出的互动和行为模式可以被视作一种文化进化现象...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page