漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-13 talkingdev

开源|Understudy:可教学的AI桌面助手,通过观察学习像人类一样操作电脑

GitHub上开源项目Understudy展示了一种新型可教学AI桌面代理的前沿理念。该项目旨在开发一个能够像人类同事一样操作计算机的智能体,其核心创新在于通过演示进行学习,而非依赖传统的脚本录制或API集成。Understudy...

Read More
2026-03-13 talkingdev

逆向工程Claude生成式UI:在终端中重建交互式AI界面

近期,一项技术探索揭示了Anthropic公司旗下AI助手Claude的生成式用户界面(Generative UI)的内部工作机制,并将其成功移植到终端环境中。该技术本质上是一种特殊的工具调用,能够将HTML代码流式注入文档对象模型(...

Read More
2026-03-11 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴近日在GitHub上开源了名为“Page Agent”的项目,这是一个运行在网页内部的JavaScript图形用户界面(GUI)智能体。该技术的核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键...

Read More
2026-03-09 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴开源项目Page Agent近日在GitHub发布,这是一个运行于浏览器页面内的JavaScript图形用户界面智能体。其核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键词”)来操控网页界...

Read More
2026-03-05 talkingdev

微软发布Phi-4推理视觉模型:15B参数实现多模态推理,懂得“何时思考”以提升效率

微软近日发布了Phi-4-reasoning-vision-15B,这是一款开源的、权重开放的多模态视觉AI模型。该模型仅包含150亿参数,却在数学、科学、文档及用户界面(UI)推理任务上,达到了与参数量大数倍的模型相当甚至更优的性...

Read More
2026-02-20 talkingdev

开源|Micasa:一款由AI编程的终端家居管理工具,数据全在单个SQLite文件中

近日,一款名为Micasa的开源工具在开发者社区引发关注。它是一款运行在终端(Terminal)的文本用户界面(TUI)应用,旨在帮助用户高效管理家庭事务,从记录洗碗机滤网清洁周期、后院改造报价,到追踪墙面霉菌处理等...

Read More
2026-02-12 talkingdev

Fluorite引擎发布:基于Flutter与Dart的次世代游戏开发方案

近日,一款名为Fluorite的次世代游戏引擎正式亮相,其最大特色在于与谷歌Flutter框架的深度集成,允许开发者直接使用Dart语言编写游戏逻辑,并充分利用Flutter成熟的工具链。该引擎在底层采用高性能C++编写的实体组...

Read More
2026-02-11 talkingdev

开源|Tambo:基于React的生成式UI SDK,让LLM智能体动态构建交互界面

Tambo AI 近日在 GitHub 上开源了一个名为 Tambo 的 React 工具包,旨在为开发者提供构建能够生成并与动态用户界面交互的 AI 智能体(Agent)的能力。该工具包的核心创新在于,它允许开发者使用 Zod 模式(Schema)...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page