OpenAI与知名加密投资及研究机构Paradigm近日联合推出了名为“EVMbench”的全新基准测试。该基准旨在系统性地评估人工智能(AI)代理在检测、修补以及利用高严重性智能合约漏洞方面的综合能力。智能合约作为区块链生态...
Read MoreOpenAI旗下的代码智能体Codex近日披露了其核心架构与运作模式,揭示了人工智能在软件开发领域应用的重大进展。Codex采用基于Rust语言构建的架构,并配备了开源命令行界面(CLI)。其核心运作机制是一个被称为“智能体...
Read More开发者Simon Willison近日为其CLI工具Showboat推出了两个重要的扩展工具:Chartroom与datasette-showboat,显著增强了AI编程代理(coding agents)在代码演示与文档生成方面的能力。Showboat的核心功能是帮助AI编程...
Read More微软正在其人工智能助手Copilot中测试名为“研究员”与“分析员”的新型智能体,这些功能将被整合到即将推出的“任务”模块中。该创新功能允许用户预先安排复杂的提示指令,并利用OpenAI的先进模型(包括o3-mini)进行深度...
Read More近日,GitHub上开源了一个名为Rowboat的AI工作伙伴项目,其核心定位是构建一个具备长期记忆能力的开源AI协作者。该项目通过智能解析用户的电子邮件和会议笔记等非结构化数据,自动构建并持续更新一个长期存在的知识...
Read More近日,开发者社区出现了一款名为CloudRouter的开源工具,它通过提供CLI和技能插件,赋予Claude Code、Codex等AI编程助手直接启动和管理云端虚拟机(VM)及GPU实例的能力。传统上,AI代理在编写代码后需在本地运行开...
Read MoreGitHub近日推出了名为‘Agentic Workflows’的技术预览项目,标志着代码仓库自动化进入了一个新阶段。该项目允许开发者在GitHub Actions环境中直接运行他们所熟悉和喜爱的各类‘编码智能体’。其核心设计原则强调‘强护栏...
Read More近期,一项由人工智能系统独立完成的安全研究引发了科技界广泛关注。该系统在2025年12月至2026年1月期间,在没有人类干预的情况下,自主执行了完整的安全研究流程,成功发现了Node.js和React这两个全球部署最广泛的J...
Read More