漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-16 talkingdev

告别Bug之吻:QA Wolf推出全自动端到端测试覆盖服务

QA Wolf推出的AI原生服务能在不到4个月内为网页和移动应用实现80%的自动化测试覆盖率。该服务基于开源框架Playwright构建并维护测试套件,同时提供在其基础设施上无限并行测试运行(含24小时维护)。以Salesloft为例...

Read More
2025-06-09 talkingdev

微软推出GUI-Actor:AI代理无需坐标即可操作屏幕界面

微软研究院最新提出的GUI-Actor技术,彻底改变了AI代理与图形用户界面(GUI)的交互方式。这项突破性技术摒弃了传统依赖像素坐标预测的方法,转而采用注意力机制直接解析屏幕截图内容,使AI能够像人类一样'理解'界面...

Read More
2025-05-26 talkingdev

GUI-explorer:无需训练的移动应用自动化探索智能体

由研究团队开发的GUI-explorer是一种突破性的无训练智能体,采用无监督学习方法自主探索移动应用界面并提取知识。该技术通过动态解析UI层级结构和视觉元素,实现了对未知应用的零样本适应能力,任务成功率提升显著且...

Read More
2025-05-23 talkingdev

开源Web Agent框架:用自然语言描述网页结构

Notte Labs近日在GitHub上开源了一款名为Notte的Web Agent框架,该框架旨在构建能够浏览并与网站交互的AI智能体。其核心创新在于引入了一个"感知层"(perception layer),该技术能够将网页内容转化为结构化的自然语...

Read More
2025-05-05 talkingdev

谷歌Gemini 2.5 Pro AI直播通关《精灵宝可梦蓝》,展现游戏领域AI潜力

谷歌最新一代多模态AI模型Gemini 2.5 Pro在非官方测试中完成了一项里程碑式挑战——通过实时直播完整通关经典游戏《精灵宝可梦蓝》。这一突破性演示由开发者社区发起,展示了大型语言模型在复杂游戏环境中的决策能力和...

Read More
2025-04-07 talkingdev

Browser MCP发布:通过Cursor、Claude和VS Code实现浏览器自动化

近日,一款名为Browser MCP的创新工具正式亮相,旨在通过集成Cursor、Claude和VS Code等开发环境,实现浏览器自动化操作。该工具允许开发者利用先进的AI技术,如LLM和agent,高效完成网页操作任务。通过embedding和L...

Read More
2025-04-02 talkingdev

Pico.sh推出基于SSH的开发者服务,简化开发流程

近日,Pico.sh宣布推出一系列基于SSH的开发者服务,旨在为开发者提供更高效、安全的开发工具。Pico.sh通过SSH协议实现快速部署和管理,支持多种开发场景,包括代码托管、自动化测试和持续集成。其核心优势在于极简的...

Read More
2025-03-13 talkingdev

[开源] PromptPex:将AI模型提示词自动化测试的开源工具

PromptPex是一个创新的开发者工具,它将AI模型中的提示词(prompts)视为函数,并自动生成测试输入,从而实现对AI模型提示词的系统化单元测试。这一工具的诞生标志着AI开发工具链的进一步完善,尤其是在提示工程(Pr...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page