对抗性攻击的相关内容 - 漫话开发者

2025-05-20 talkingdev

[论文推荐]LLM安全评估系统的鲁棒性研究揭示重大漏洞

最新发表在arXiv的研究论文指出，基于大语言模型(LLM)的安全评估系统存在显著脆弱性。研究表明，这类系统的评估可靠性极易受到提示词敏感性和对抗性攻击的影响。该发现对当前快速发展的AI安全评估领域具有重要警示意...

2023-11-22 talkingdev

一份在GitHub上公布的AI应用程序漏洞列表显示，已经发现并负责任地披露了多个AI应用程序的漏洞。这些漏洞包括机器学习模型中的数据泄露、对抗性攻击和针对自然语言处理模型的攻击等。该列表旨在帮助AI开发人员和研究...