OpenCUA项目近日发布了一套全面的开源工具包,旨在构建高效的计算机使用智能体。该工具包包含数据收集工具、训练流程,以及覆盖三大操作系统和200余款应用的2.2万条人类操作轨迹数据。其核心创新在于"反射式长链思维...
Read More最新研究指出,'末日提示'(Doomprompting)现象正在人工智能交互领域蔓延,这种从有目的的查询逐渐退化为无意识迭代循环的行为模式,已成为数字时代的新型成瘾症状。与被动消费信息的'末日刷屏'(doomscrolling)不同,...
Read More据最新消息,OpenAI正在开发一款基于Chromium的浏览器,该浏览器将采用Agent模式来控制用户操作。Agent模式正在升级,可选择在远程云/虚拟浏览器或第一方本地浏览器上运行。值得注意的是,云浏览器功能似乎仅作为备...
Read More苹果公司近日在GitHub开源了Embedding Atlas项目,这是一款专为大规模嵌入数据设计的交互式可视化工具。该工具通过WebGPU加速实现高性能渲染,支持自动数据聚类标注、实时交叉筛选和元数据搜索三大核心功能。其技术...
Read More开发者Wyatt Joh近日在JSR平台发布了两个开源工具包@wyattjoh/imessage和@wyattjoh/imessage-mcp,这些工具允许大型语言模型(LLM)如Claude在macOS系统上以只读方式访问用户的iMessage数据库。这一创新技术使用户能...
Read More谷歌Gemini Deep Research团队正在开发名为Deep Research API的创新工具,该技术将彻底改变传统研究模式。这一API具备强大的自动化研究能力,可在几分钟内完成数百个网站的智能浏览、信息深度分析及生成多页洞察报告...
Read More最新数据显示,从1月到5月,由人工智能驱动的网络流量激增527%,以ChatGPT和Perplexity为代表的大型语言模型(LLMs)正在重塑用户与互联网的互动方式。法律、金融和健康行业在AI来源的会话中处于领先地位,这表明用...
Read More谷歌近日宣布为其AI聊天机器人Gemini推出重大更新,新增自动记忆功能。该功能默认开启,允许Gemini无需用户提示即可记住过往对话内容,自动识别关键细节和用户偏好,并据此提供个性化输出。目前,该功能已开始向部分...
Read More