人机交互的相关内容 - 漫话开发者

2026-03-16 talkingdev

Sentry实践：为AI智能体优化内容，将Markdown作为新接口标准

随着前沿大语言模型等AI智能体日益成为重要的信息消费与交互主体，传统为人类设计的网页内容格式已显露出局限性。科技公司Sentry率先将‘为智能体优化内容’视为一个真实的接口问题付诸实践。其核心理念在于，AI智能体...

2026-03-13 talkingdev

GitHub上开源项目Understudy展示了一种新型可教学AI桌面代理的前沿理念。该项目旨在开发一个能够像人类同事一样操作计算机的智能体，其核心创新在于通过演示进行学习，而非依赖传统的脚本录制或API集成。Understudy...

2026-03-13 talkingdev

近期，一项技术探索揭示了Anthropic公司旗下AI助手Claude的生成式用户界面（Generative UI）的内部工作机制，并将其成功移植到终端环境中。该技术本质上是一种特殊的工具调用，能够将HTML代码流式注入文档对象模型（...

2026-03-11 talkingdev

阿里巴巴近日在GitHub上开源了名为“Page Agent”的项目，这是一个运行在网页内部的JavaScript图形用户界面（GUI）智能体。该技术的核心创新在于，允许用户直接使用自然语言指令（如“点击登录按钮”或“在搜索框输入关键...

2026-03-11 talkingdev

Meta公司近日宣布收购了Moltbook，这是一个类似于Reddit的社交网络平台，但其独特之处在于其用户主体并非人类，而是基于OpenClaw框架构建的AI智能体。该平台的核心机制是让这些AI智能体相互交流、互动，并维护一个持...

2026-03-09 talkingdev

阿里巴巴开源项目Page Agent近日在GitHub发布，这是一个运行于浏览器页面内的JavaScript图形用户界面智能体。其核心创新在于，允许用户直接使用自然语言指令（如“点击登录按钮”或“在搜索框输入关键词”）来操控网页界...

2026-02-17 talkingdev

WebMCP API是一项前沿的Web技术提案，它定义了一个全新的JavaScript接口，旨在弥合Web应用与AI代理之间的鸿沟。通过该接口，Web开发者可以将自己应用中的特定功能（如数据查询、表单提交、内容生成等）封装成带有自...

2026-02-12 talkingdev

近日，技术研究团队对Perplexity推出的名为Comet的智能体浏览器进行了深入的技术剖析。Comet并非传统意义上的浏览器，而是一个配备了先进AI模型的“代理式浏览器”，其核心能力在于能够自主地与网页内容进行交互。该分...