最新发表在arXiv的研究论文揭示,Anthropic公司开发的Claude 3.5 Sonnet大型语言模型在说服力测试中展现出超越人类的表现。在严格控制的人机对比实验中,当双方都试图影响参与者回答测验问题时,Claude模型取得了7.6...
Read MoreMeta旗下FAIR(基础人工智能研究)团队近日宣布推出多项重要开源成果,涵盖三大前沿领域:1) 分子属性预测数据集与模型,将加速药物发现与材料科学研发流程;2) 扩散模型(Diffusion Models)相关资源,为当前最热门...
Read More在被OpenAI收购后,Windsurf正式推出全新编程专用模型家族:旗舰级SWE-1(性能对标Claude Sonnet 3.5)、无使用限制的SWE-1-lite以及轻量版SWE-1-mini。该公司宣称,这些基于非完整代码状态和多工作界面训练的专业模...
Read More近日,一篇关于大型语言模型(LLM)智能体循环结合工具使用的文章引发了广泛讨论。该文章探讨了LLM智能体在循环过程中如何有效利用外部工具,从而显著提升其性能和实用性。这一技术突破不仅展示了LLM在实际应用中的...
Read More微软正计划在其Azure AI Foundry平台上托管埃隆·马斯克开发的Grok人工智能模型,这一举措可能将于5月19日举行的微软Build开发者大会上正式宣布。尽管微软与OpenAI存在潜在竞争关系,但这一战略部署凸显了微软意图通...
Read More自动化工具开发商Manus宣布取消其虚拟桌面AI代理的等待名单机制,向所有用户开放基础服务。该平台现提供每日1次免费任务额度,并赠送新用户1000信用点的一次性奖励。这一举措将此前备受业界关注的智能自动化工具准入...
Read MoreOpenDriveLab团队在GitHub开源了UniVLA框架,这项突破性技术通过推断任务中心的潜在动作,实现了从无标注视频中学习跨机器人平台的通用策略。该框架采用先进的视觉-语言-动作联合建模方法,能自适应不同机械结构的机...
Read More强化学习领域取得重要突破,研究人员开发出一种新型actor-critic算法,通过结合离线数据和针对性探索,在混合强化学习场景中实现了接近最优的样本效率。该研究解决了长期困扰强化学习领域的核心挑战——如何在有限的实...
Read More