Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read More近日,一个名为ClawSec的综合性安全技能套件在GitHub开源发布,该项目专为OpenClaw系列AI智能体设计,旨在为AI代理的运行环境提供端到端的安全防护。该套件集成了多项前沿安全技术,包括自动化安全审计、实时安全建...
Read MoreGitHub近日正式推出Agentic Workflows,这是一项旨在深度集成于GitHub Actions平台、通过AI编码代理实现代码库自动化管理的前沿功能。用户无需编写复杂的YAML脚本,仅需使用Markdown文件以自然语言描述期望的自动化...
Read More网络安全与访问管理公司StrongDM近日公开了其创新的“软件工厂”概念,标志着AI代理在软件开发领域向非交互式自主化迈出了关键一步。该工厂的核心在于,AI代理能够根据给定的规格说明和场景描述,完全自主地编写、迭代...
Read More近日,知名Python数据验证库Pydantic团队在GitHub上开源了一个名为Monty的项目,这是一个用Rust编写的、极简且安全的Python解释器,专为人工智能应用场景设计。该项目旨在解决一个关键痛点:如何安全地执行由大型语...
Read More近期,一个值得关注的现象是Mac Mini在全球多地售罄,其背后驱动力并非传统创意软件需求,而是用户将其作为运行AI智能体(Agent)的无头(headless)服务器,以实现工作流程自动化。这一趋势的核心是开源框架OpenCla...
Read MoreGitHub近日宣布,其AI编程助手Copilot迎来重大功能扩展,正式在公开预览阶段引入两大业界领先的AI编码代理:Anthropic公司的Claude与OpenAI的Codex。此次更新面向Copilot Pro+和Copilot Enterprise订阅用户,标志着G...
Read More近日,一个名为RS-SDK的开源项目在开发者社区引发关注。该项目是一个专门为经典大型多人在线角色扮演游戏《RuneScape》设计的自动化库,其核心创新点在于明确宣称“为编码代理(coding agents)优化”。这意味着该库并...
Read More