AI安全的相关内容 - 漫话开发者

2026-04-28 talkingdev

GPT-5.5系统卡发布：性能逼近Claude Opus，事实查询与任务执行成亮点

OpenAI最新发布的GPT-5.5模型系统卡（System Card）揭示了其性能表现与安全评估结果。这份详尽的报告显示，GPT-5.5在多项基准测试中表现出色，尤其在事实性查询、网络搜索和结构化任务执行上，已能与业界顶尖模型Cla...

2026-04-25 talkingdev

据彭博社独家报道，科技巨头谷歌计划向人工智能初创公司Anthropic投资高达400亿美元。这一巨额投资规模，超越了此前微软对OpenAI的数十亿美元注资，标志着AI领域的资本竞赛进入白热化阶段。Anthropic作为OpenAI的主...

2026-04-22 talkingdev

近日，一项名为CrabTrap的开源项目引起了AI应用安全领域的关注。它是一个HTTP/HTTPS代理，核心功能是拦截AI代理发出的每一个网络请求，并利用“LLM即法官”的技术范式，实时判断该请求是否符合为该代理预设的流量许可...

2026-04-12 talkingdev

近期，一篇题为《Mythos之后：AI网络安全的锯齿状前沿》的技术博客引发了广泛讨论。文章核心观点指出，在AI驱动的网络安全领域，真正的护城河并非单一模型的能力，而在于整个系统架构。值得注意的是，文中提及不仅大...

2026-04-10 talkingdev

近日，GitHub上出现了一个名为“reverse-SynthID”的开源项目，引发了科技社区的高度关注。该项目旨在对谷歌DeepMind旗下Gemini模型所采用的SynthID图像水印检测技术进行逆向工程分析。SynthID是谷歌为应对AI生成图像...

2026-04-06 talkingdev

Anthropic的研究员Nicholas Carlini近期利用其AI编程助手Claude Code，成功发现了Linux内核中的多个安全漏洞，其中最引人注目的是一项在NFS（网络文件系统）驱动程序中潜藏了23年之久的堆缓冲区溢出漏洞。这一发现不...

2026-03-27 talkingdev

随着人工智能技术在各类工具、应用和智能体中的快速普及，其部署速度已远超企业现有的治理与安全管控能力。当前，安全团队面临的核心挑战已从传统边界防护，转向管理AI交互过程中的动态风险：包括输入数据的敏感性、...

2026-03-19 talkingdev

NVIDIA近日在GitHub上开源了NemoClaw项目，这是一个旨在简化和保障OpenClaw“始终在线”助手安全运行的软件栈。其核心创新在于通过安装NVIDIA OpenShell运行时，为OpenClaw创建一个严格隔离的沙盒环境。在该环境中，所...