可信AI系统的相关内容 - 漫话开发者

2025-11-25 talkingdev

重磅发布：Anthropic推出Claude Opus 4.5模型，AI安全领域再获突破

人工智能安全与研究公司Anthropic正式发布Claude Opus 4.5模型，标志着可信AI系统建设迈入新阶段。作为专注于构建可靠、可解释与可操控AI系统的先锋企业，Anthropic此次更新延续了其在前沿AI安全技术领域的深度布局...

2025-11-03 talkingdev

Meta公司近日在官方博客提出名为‘Agent双能力法则’的AI安全框架，旨在解决AI智能体面临的提示注入攻击隐患。该规则要求单个AI代理在会话周期内最多只能同时具备三项核心能力中的两项：处理非可信用户输入、访问私有...