漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-05 talkingdev

L-MAP技术革新:提升离线强化学习中的序列决策能力

近日,L-MAP技术在离线强化学习(Offline RL)领域取得了显著进展,特别是在处理随机、高维连续动作空间中的序列决策问题。L-MAP通过结合VQ-VAE模型,成功学习并优化了宏动作(macro-actions),从而显著提升了决策...

Read More
2025-03-05 talkingdev

多目标强化学习效率提升:新型奖励降维方法突破传统限制

近日,一项针对多目标强化学习(Multi-Objective Reinforcement Learning, MORL)的创新研究取得了重要进展。该研究提出了一种新型奖励降维方法,显著提升了学习效率,突破了传统方法的局限性。传统的多目标强化学习...

Read More
2024-12-24 talkingdev

探索未来:同事Julius的智能体助手技术

同事Julius是一系列技术新闻中的主角,这些新闻围绕人工智能、机器学习和自然语言处理等前沿技术展开。Julius代表了现代技术的一个缩影,尤其在智能助手领域。智能助手技术借助于LLM(大型语言模型)、agent(智能代...

Read More
2024-12-19 talkingdev

论文:深度解析LLM Agent间的合作文化演进

近期研究聚焦于大型语言模型(LLM)代理之间的合作文化演进。在人工智能领域,LLM代理被设计为能够理解和生成自然语言的智能体。当这些代理被赋予合作任务时,它们展现出的互动和行为模式可以被视作一种文化进化现象...

Read More
2024-10-16 talkingdev

苹果发布专为Apple Intelligence设计的iPad mini

苹果公司近日发布了新款iPad mini,该设备特别为Apple Intelligence优化,旨在提升用户的智能体验。新款iPad mini集成了先进的LLM和agent技术,使其在处理复杂任务时更为高效。用户可以利用嵌入式系统实现更个性化的...

Read More
2024-07-02 talkingdev

论文:在多智能体Agent模型中更好地探索-QMIX的改进

科研人员已经通过在最大熵框架内增加了一个局部Q价值学习方法,改进了被广泛应用的多智能体强化学习方法QMIX。QMIX是一个众所周知的多代理强化学习方法,它能有效地解决多代理学习中的挑战,如策略的协调和通信难题...

Read More
2024-07-01 talkingdev

Llama Agents-新一代多智能体系统构建框架

Llama Agents是一个以异步为首的框架,用于构建、迭代和生产多智能体系统,包括多智能体通信,分布式工具执行,人在环中等等。Llama Agents的目标是提供一个强大、灵活且易于使用的框架,以支持开发者在各种场景中快...

Read More
2024-03-22 talkingdev

苹果与谷歌洽谈,或将集成Gemini AI技术于iPhone

苹果公司正在与谷歌进行谈判,以期将Gemini生成性AI技术集成到iPhone中。此外,苹果也在考虑使用OpenAI的ChatGPT。这一举措标志着苹果在人工智能领域的雄心壮志,可能为iPhone用户带来前所未有的智能体验。若谈判顺...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page