AI安全攻防新标杆:OpenAI与Paradigm联合发布智能合约漏洞评估基准EVMbench
talkingdev • 2026-02-19
1879 views
OpenAI与知名加密投资及研究机构Paradigm近日联合推出了名为“EVMbench”的全新基准测试。该基准旨在系统性地评估人工智能(AI)代理在检测、修补以及利用高严重性智能合约漏洞方面的综合能力。智能合约作为区块链生态的核心组件,目前承载着数千亿美元加密资产的安全,其代码安全性至关重要。随着AI代理技术的飞速发展,在具有重大经济意义的环境中准确衡量其安全能力变得日益重要。EVMbench的推出不仅为衡量AI在复杂金融环境下的攻防水平提供了标准化工具,也标志着利用AI系统对已部署合约进行主动防御性审计和加固,正从概念走向实践。这一基准有望推动AI安全研究、智能合约审计自动化以及区块链安全生态的协同发展,为防范大规模金融风险提供前沿技术解决方案。
核心要点
- EVMbench是首个由OpenAI与Paradigm联合推出的、专注于评估AI代理处理智能合约高严重性漏洞能力的基准测试。
- 该基准的核心价值在于在涉及巨额真实资产的“经济意义环境”中,量化AI的漏洞检测、修补及利用等攻防综合能力。
- 其长远目标是推动利用AI技术主动进行防御性安全审计,从而加固已部署的智能合约,提升整个区块链生态的安全水位。