漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-19 talkingdev

[论文推荐]大型语言模型说服力超越人类:Claude 3.5 Sonnet在辩论实验中表现优异

最新发表在arXiv的研究论文揭示,Anthropic公司开发的Claude 3.5 Sonnet大型语言模型在说服力测试中展现出超越人类的表现。在严格控制的人机对比实验中,当双方都试图影响参与者回答测验问题时,Claude模型取得了7.6...

Read More
2025-05-16 talkingdev

Meta FAIR团队发布支持分子属性预测、扩散建模和语言学习神经科学的新数据集与模型

Meta旗下FAIR(基础人工智能研究)团队近日宣布推出多项重要开源成果,涵盖三大前沿领域:1) 分子属性预测数据集与模型,将加速药物发现与材料科学研发流程;2) 扩散模型(Diffusion Models)相关资源,为当前最热门...

Read More
2025-05-16 talkingdev

Windsurf发布自研编程模型家族,剑指通用大模型性能超越

在被OpenAI收购后,Windsurf正式推出全新编程专用模型家族:旗舰级SWE-1(性能对标Claude Sonnet 3.5)、无使用限制的SWE-1-lite以及轻量版SWE-1-mini。该公司宣称,这些基于非完整代码状态和多工作界面训练的专业模...

Read More
2025-05-16 talkingdev

LLM智能体循环结合工具使用的惊人效果

近日,一篇关于大型语言模型(LLM)智能体循环结合工具使用的文章引发了广泛讨论。该文章探讨了LLM智能体在循环过程中如何有效利用外部工具,从而显著提升其性能和实用性。这一技术突破不仅展示了LLM在实际应用中的...

Read More
2025-05-14 talkingdev

微软计划在Azure AI Foundry上托管马斯克的Grok AI模型

微软正计划在其Azure AI Foundry平台上托管埃隆·马斯克开发的Grok人工智能模型,这一举措可能将于5月19日举行的微软Build开发者大会上正式宣布。尽管微软与OpenAI存在潜在竞争关系,但这一战略部署凸显了微软意图通...

Read More
2025-05-13 talkingdev

Manus取消等待名单限制 虚拟桌面AI助手全面开放免费体验

自动化工具开发商Manus宣布取消其虚拟桌面AI代理的等待名单机制,向所有用户开放基础服务。该平台现提供每日1次免费任务额度,并赠送新用户1000信用点的一次性奖励。这一举措将此前备受业界关注的智能自动化工具准入...

Read More
2025-05-13 talkingdev

UniVLA-开源通用机器人策略框架,无标注视频学习

OpenDriveLab团队在GitHub开源了UniVLA框架,这项突破性技术通过推断任务中心的潜在动作,实现了从无标注视频中学习跨机器人平台的通用策略。该框架采用先进的视觉-语言-动作联合建模方法,能自适应不同机械结构的机...

Read More
2025-05-09 talkingdev

[论文推荐]基于离线数据的Actor-Critic学习算法实现近最优样本效率

强化学习领域取得重要突破,研究人员开发出一种新型actor-critic算法,通过结合离线数据和针对性探索,在混合强化学习场景中实现了接近最优的样本效率。该研究解决了长期困扰强化学习领域的核心挑战——如何在有限的实...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page