OpenAI与Anthropic达成AI安全互测协议，共筑行业安全新标准

talkingdev • 2025-08-28

962444 views

OpenAI与Anthropic近日达成一项突破性合作，双方开放内部API接口进行交叉安全测试，旨在通过第三方视角发现彼此模型评估中的盲点。这一举措标志着AI行业从封闭式自查向开放式协作安全验证的重要转变。通过技术互鉴，双方将共同应对大语言模型可能存在的对齐失效、价值锁定和潜在滥用风险。该合作不仅为AI安全研究提供了新范式，还可能推动建立行业通用的红队测试标准，对确保下一代AI系统的可控性与安全性具有里程碑意义。专家认为，这种跨组织协作机制或将成为AI治理领域的新基准。

核心要点

OpenAI与Anthropic首次实现API级安全互测
旨在通过交叉验证发现模型评估盲点
为AI行业建立安全测试新标准

OpenAI与Anthropic达成AI安全互测协议，共筑行业安全新标准

核心要点

Related posts