Anthropic最新研究通过‘概念注入’实验,首次系统验证了大语言模型的内省能力。研究显示,特别是Claude Opus 4和4.1版本模型能够检测并识别被注入的概念,并能通过参照自身‘意图’来识别意外输出。实验证明这些模型具...
Read MoreMeta公司近日在官方博客提出名为‘Agent双能力法则’的AI安全框架,旨在解决AI智能体面临的提示注入攻击隐患。该规则要求单个AI代理在会话周期内最多只能同时具备三项核心能力中的两项:处理非可信用户输入、访问私有...
Read MoreOxide计算机公司在控制平面开发中发现了一种名为Futurelock的深层异步编程隐患。这种问题与之前发现的异步取消问题类似但更具隐蔽性——从程序员视角看,遭遇Futurelock的程序逻辑完全正确,但实际运行时可能陷入死锁...
Read More近日,技术研究者enaix在个人博客中披露了一种理论上可绕过Android开发者验证机制的方法。该研究通过分析Android系统对开发者身份的验证流程,揭示了潜在的设计缺陷。虽然目前尚未发现实际攻击案例,但该理论漏洞若...
Read More思科AI防御实验室近日在GitHub开源了MCP-Scanner工具,专门用于检测MCP(Model Context Protocol)服务器的安全漏洞。该项目上线后迅速获得技术社区关注,在Hacker News平台收获127点讨论热度并引发36条专业评论,反...
Read More谷歌Angular团队正式开源Web Codegen Scorer工具,专门用于评估大语言模型生成的网页代码质量。该工具通过构建成功率、安全漏洞检测、编码规范遵循等核心维度,对LLM生成的HTML/CSS/JavaScript代码进行量化评分。开...
Read MoreOpenAI正式推出面向ChatGPT Business、Enterprise和Edu用户的‘企业知识’功能,标志着生成式AI在企业级应用领域取得重大突破。该功能通过连接企业内部多种应用系统(如CRM、文档库、项目管理工具),构建出专属知识图...
Read More人工智能安全与研究公司Anthropic正式推出基于浏览器的Claude Code测试版本,标志着AI编程助手进入云端协作新阶段。该平台突破性地支持用户直接连接GitHub仓库,实现跨多个代码库的并行任务处理能力。每个编程会话均...
Read More