漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-13 talkingdev

开源|Understudy:可教学的AI桌面助手,通过观察学习像人类一样操作电脑

GitHub上开源项目Understudy展示了一种新型可教学AI桌面代理的前沿理念。该项目旨在开发一个能够像人类同事一样操作计算机的智能体,其核心创新在于通过演示进行学习,而非依赖传统的脚本录制或API集成。Understudy...

Read More
2026-03-13 talkingdev

逆向工程Claude生成式UI:在终端中重建交互式AI界面

近期,一项技术探索揭示了Anthropic公司旗下AI助手Claude的生成式用户界面(Generative UI)的内部工作机制,并将其成功移植到终端环境中。该技术本质上是一种特殊的工具调用,能够将HTML代码流式注入文档对象模型(...

Read More
2026-03-11 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴近日在GitHub上开源了名为“Page Agent”的项目,这是一个运行在网页内部的JavaScript图形用户界面(GUI)智能体。该技术的核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键...

Read More
2026-03-11 talkingdev

Meta收购Moltbook:因虚假帖子爆火的AI智能体社交网络

Meta公司近日宣布收购了Moltbook,这是一个类似于Reddit的社交网络平台,但其独特之处在于其用户主体并非人类,而是基于OpenClaw框架构建的AI智能体。该平台的核心机制是让这些AI智能体相互交流、互动,并维护一个持...

Read More
2026-03-09 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴开源项目Page Agent近日在GitHub发布,这是一个运行于浏览器页面内的JavaScript图形用户界面智能体。其核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键词”)来操控网页界...

Read More
2026-02-17 talkingdev

开源|WebMCP:让Web应用功能成为AI代理的“工具箱”

WebMCP API是一项前沿的Web技术提案,它定义了一个全新的JavaScript接口,旨在弥合Web应用与AI代理之间的鸿沟。通过该接口,Web开发者可以将自己应用中的特定功能(如数据查询、表单提交、内容生成等)封装成带有自...

Read More
2026-02-12 talkingdev

深度解析Perplexity Comet:揭秘AI自主浏览器的架构与交互机制

近日,技术研究团队对Perplexity推出的名为Comet的智能体浏览器进行了深入的技术剖析。Comet并非传统意义上的浏览器,而是一个配备了先进AI模型的“代理式浏览器”,其核心能力在于能够自主地与网页内容进行交互。该分...

Read More
2026-02-05 talkingdev

OpenClaw:开源AI自动化框架,或成苹果智能战略的“错失良机”

近期,一个值得关注的现象是Mac Mini在全球多地售罄,其背后驱动力并非传统创意软件需求,而是用户将其作为运行AI智能体(Agent)的无头(headless)服务器,以实现工作流程自动化。这一趋势的核心是开源框架OpenCla...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page