漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-11 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴近日在GitHub上开源了名为“Page Agent”的项目,这是一个运行在网页内部的JavaScript图形用户界面(GUI)智能体。该技术的核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键...

Read More
2026-03-09 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴开源项目Page Agent近日在GitHub发布,这是一个运行于浏览器页面内的JavaScript图形用户界面智能体。其核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键词”)来操控网页界...

Read More
2025-08-03 talkingdev

开源浏览器插件starchive-将YouTube视频自动发送到本地

近日,GitHub上出现了一个名为starchive的开源项目,该项目由开发者andrewarrow创建,主要功能是通过浏览器插件将YouTube视频自动发送到本地后端进行存档。这一工具的出现,为那些希望保存YouTube视频内容的用户提供...

Read More
2024-08-05 talkingdev

Buster开源:模拟人类识别验证码终极解决方案

Buster是一种用于解决人类面临的验证码难题的工具。在网上购物,注册账户或使用某些在线服务时,很难避免遇到验证码。这些验证码通常是为了保护网站免受恶意行为的攻击,但对于人类来说,它们可能是一个巨大的挑战。...

Read More