OpenAI最新推出的gpt-oss-safeguard系列模型(包含1200亿和200亿参数版本)标志着AI安全技术的重要突破。该模型创新性地允许开发者在推理阶段直接应用定制化安全策略,无需像传统方法那样依赖数千个标注样本训练分类...
Read More当前公众对软件漏洞的认知存在关键误区——传统软件的缺陷源于代码错误,可通过精确定位实现彻底修复;而AI系统的脆弱性则根植于海量训练数据,导致错误源头难以追溯或完全消除。这一差异揭示了AI安全的根本挑战:传统...
Read More一项名为cchistory的逆向工程项目成功追踪了Anthropic公司旗下Claude Code人工智能助手67个版本的系统提示词演变过程。该项目通过突破反调试保护措施,揭示了AI公司如何通过精细调整系统指令(而非单纯模型升级)来...
Read More安全研究机构Trail of Bits近日宣布推出mcp-context-protector测试版,这是专为采用模型上下文协议(MCP)的大型语言模型(LLM)应用程序设计的安全防护层。该解决方案能有效防御此前披露的各类边界突破攻击,包括通过工...
Read More近日,一位开发者成功逆向工程了Apple Intelligence生成式模型的安全过滤器加密机制(在框架中被称为“混淆”),并将这些过滤器提取到一个公开的GitHub仓库中。这一发现揭示了苹果如何在其AI模型中实施内容安全控制,...
Read More数据备份工具 BorgBackup 在最新版本 2.0 中移除了服务端仅追加(append-only)模式的支持功能。这一变更源于 PR#8798,由开发者 ThomasWaldmann 提出并实施。仅追加模式原本是 BorgBackup 的一项重要安全特性,它通...
Read More谷歌工程师团队在GitHub上发布了一项名为'Local Network Access'的提案,旨在通过技术手段限制网站未经用户明确授权访问其本地网络资源的能力。该提案针对当前Web安全体系中存在的潜在风险,即恶意网站可能利用浏览...
Read More开发者Kiet及其团队推出的Onlook(https://beta.onlook.com/)是一款开源视觉编辑器,专为React应用设计,支持在无限画布上实时编辑和创建应用。该项目最初作为本地优先的Electron应用发布,后全面转向浏览器环境以...
Read More