OpenAI与Anthropic达成AI安全互测协议,共筑行业安全新标准
talkingdev • 2025-08-28
2219 views
OpenAI与Anthropic近日达成一项突破性合作,双方开放内部API接口进行交叉安全测试,旨在通过第三方视角发现彼此模型评估中的盲点。这一举措标志着AI行业从封闭式自查向开放式协作安全验证的重要转变。通过技术互鉴,双方将共同应对大语言模型可能存在的对齐失效、价值锁定和潜在滥用风险。该合作不仅为AI安全研究提供了新范式,还可能推动建立行业通用的红队测试标准,对确保下一代AI系统的可控性与安全性具有里程碑意义。专家认为,这种跨组织协作机制或将成为AI治理领域的新基准。