漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-26 talkingdev

GUI-explorer:无需训练的移动应用自动化探索智能体

由研究团队开发的GUI-explorer是一种突破性的无训练智能体,采用无监督学习方法自主探索移动应用界面并提取知识。该技术通过动态解析UI层级结构和视觉元素,实现了对未知应用的零样本适应能力,任务成功率提升显著且...

Read More
2025-05-23 talkingdev

[论文推荐]字节跳动发布开源多模态基础模型BAGEL,支持跨模态理解与生成

字节跳动最新发布的开源多模态基础模型BAGEL在技术领域引发广泛关注。该模型原生支持多模态理解与生成任务,在开源统一模型中表现优异。BAGEL展现出先进的跨模态推理能力,包括图像编辑、3D场景操作和世界导航等复杂...

Read More
2025-05-23 talkingdev

开源Web Agent框架:用自然语言描述网页结构

Notte Labs近日在GitHub上开源了一款名为Notte的Web Agent框架,该框架旨在构建能够浏览并与网站交互的AI智能体。其核心创新在于引入了一个"感知层"(perception layer),该技术能够将网页内容转化为结构化的自然语...

Read More
2025-05-23 talkingdev

安全研究员利用OpenAI o3模型发现Linux内核SMB实现中的远程零日漏洞(CVE-2025-37899)

一位安全研究员近日披露了如何利用OpenAI的o3模型发现了Linux内核SMB实现中的一个远程零日漏洞(CVE-2025-37899)。该研究展示了大型语言模型在代码推理能力上的重大突破,研究员直接使用o3 API,无需任何脚手架、代理...

Read More
2025-05-23 talkingdev

基于LLM的智能体开发框架:评估驱动的新范式

近日,一篇关于构建基于大语言模型(LLM)的智能体系统的实践框架引发业内关注。该框架提出以评估为核心的开发方法论(Evaluation-centric Development),为AI智能体的研发提供了系统性指导。文章深入探讨了如何通...

Read More
2025-05-21 talkingdev

[论文推荐]强化学习权威教材更新:涵盖传统方法到DPO、GPRO等前沿技术

谷歌高被引研究员Kevin Murphy近期更新了其200页的强化学习权威教材,系统性地覆盖了从传统方法到直接偏好优化(DPO)、广义策略优化(GPRO)以及推理技术等最前沿进展。该教材作为领域内的标杆性文献,不仅整合了经...

Read More
2025-05-20 talkingdev

[论文推荐]LLM安全评估系统的鲁棒性研究揭示重大漏洞

最新发表在arXiv的研究论文指出,基于大语言模型(LLM)的安全评估系统存在显著脆弱性。研究表明,这类系统的评估可靠性极易受到提示词敏感性和对抗性攻击的影响。该发现对当前快速发展的AI安全评估领域具有重要警示意...

Read More
2025-05-20 talkingdev

[开源]基于AWS低成本微调Qwen2.5B模型实现推理能力突破

GitHub最新开源项目展示了一种针对Qwen2.5B大语言模型的创新微调方案,该方案采用SFT(监督微调)结合GRPO(梯度反向传播优化)的混合训练框架,其技术路线受到DeepSeek R1架构启发,并针对AWS云平台进行了专项优化...

Read More
  1. Prev Page
  2. 26
  3. 27
  4. 28
  5. Next Page