漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-26 talkingdev

新型多模态基准套件SpatialScore发布,评估大模型3D空间推理能力

研究人员近日推出名为SpatialScore的多模态基准测试套件,专门用于评估大型模型在3D空间理解方面的能力。这一创新性基准整合了来自12个不同数据集的28,000个样本,为衡量AI系统的空间推理性能提供了全面且标准化的评...

Read More
2025-05-26 talkingdev

GUI-explorer:无需训练的移动应用自动化探索智能体

由研究团队开发的GUI-explorer是一种突破性的无训练智能体,采用无监督学习方法自主探索移动应用界面并提取知识。该技术通过动态解析UI层级结构和视觉元素,实现了对未知应用的零样本适应能力,任务成功率提升显著且...

Read More
2025-05-26 talkingdev

Hugging Face推出基于MCP协议的Python微型智能体,仅需70行代码实现工具集成

Hugging Face近期将其Tiny Agent设计理念扩展至Python领域,通过创新的模型上下文协议(Model Context Protocol, MCP)显著简化了大语言模型(LLMs)的工具集成流程。这一突破性进展使开发者仅需约70行代码即可构建...

Read More
2025-05-26 talkingdev

OpenAI推出O3 Operator升级版:CUA驱动的浏览器代理取代GPT-4o模型

OpenAI近日宣布其浏览器智能代理O3 Operator完成重大升级,原基于GPT-4o的模型架构已被全新的CUA(Cognitive Unified Architecture)技术体系取代。这一变革标志着OpenAI在轻量化AI代理领域取得突破性进展——CUA架构...

Read More
2025-05-25 talkingdev

[开源] Lottie:开源的动画矢量图形格式

Lottie是一种开源的动画矢量图形格式,由Airbnb开发并开源,旨在为设计师和开发者提供一种高效、灵活的方式来创建和展示高质量的动画。Lottie通过JSON文件格式存储动画数据,支持跨平台使用,包括Web、iOS、Android...

Read More
2025-05-24 talkingdev

研究人员利用o3模型发现Linux内核SMB实现中的远程零日漏洞CVE-2025-37899

近日,一位研究人员通过OpenAI的o3模型成功发现了Linux内核SMB实现中的一个远程零日漏洞(CVE-2025-37899)。该漏洞的发现过程仅使用了o3 API,展示了AI在网络安全领域的强大潜力。SMB(Server Message Block)协议...

Read More
2025-05-23 talkingdev

Mermaid-用Markdown语法生成流程图和时序图

GitHub开源项目mermaid-js/mermaid提供了一种革命性的图表生成方案,允许开发者通过类似Markdown的简洁语法快速创建专业级流程图、时序图等技术图表。该项目采用纯文本描述生成可视化图形的设计理念,大幅降低了技术...

Read More
2025-05-23 talkingdev

大语言模型作为决策法官不可靠:集体智慧项目揭示隐藏偏见

集体智慧项目(CIP)最新研究指出,当大语言模型(LLM)被应用于敏感领域的决策判断时,即便采用常见的提示工程方法,其裁决仍表现出不可预测的隐藏测量偏差,导致结果不可靠。研究发现,位置偏好、顺序效应和提示敏...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page