安全策略的相关内容 - 漫话开发者

2026-06-10 talkingdev

Anthropic发布Claude Fable 5：面向通用场景的“神话级”模型，强化安全与多域能力

Anthropic近日正式推出了两款全新的模型：Claude Fable 5和Claude Mythos 5。其中，Claude Fable 5是一款经过安全适配、面向大众场景的“Mythos级”模型，标志着Anthropic在强化模型能力与可控性之间取得了关键平衡。...

2026-05-28 talkingdev

OpenAI 近日发布了一项名为 Secure MCP Tunnel 的新功能，旨在解决企业级用户将私有或本地 MCP 服务器与 OpenAI 产品安全连接的核心痛点。该技术通过一个仅支持出站连接的隧道（outbound-only tunnel），允许用户在...

2026-05-19 talkingdev

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示，该模型的政治审查并非根植于其预训练阶段获取的事实性知识，而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现，模型本身并未“...

2026-04-22 talkingdev

近日，一项名为CrabTrap的开源项目引起了AI应用安全领域的关注。它是一个HTTP/HTTPS代理，核心功能是拦截AI代理发出的每一个网络请求，并利用“LLM即法官”的技术范式，实时判断该请求是否符合为该代理预设的流量许可...

2026-04-03 talkingdev

近日，SafeAI-Lab-X团队在GitHub上开源了名为ClawKeeper的安全防护框架，旨在为OpenClaw系列自主智能体提供全面的实时安全保障。该框架被喻为“OpenClaw的诺顿”，其核心创新在于构建了一个多层次、纵深防御的安全体系...

2026-03-20 talkingdev

在当今API驱动的微服务架构中，Webhooks作为实现实时、异步通信的关键技术，已成为现代应用开发的标配。然而，许多开发团队，包括知名金融科技公司Brex的经验所示，尽管深知Webhooks的必要性，却常因开发资源（带宽...

2026-03-19 talkingdev

NVIDIA近日在GitHub上开源了NemoClaw项目，这是一个旨在简化和保障OpenClaw“始终在线”助手安全运行的软件栈。其核心创新在于通过安装NVIDIA OpenShell运行时，为OpenClaw创建一个严格隔离的沙盒环境。在该环境中，所...

2025-12-28 talkingdev

《华盛顿邮报》报道了一起涉及人工智能与青少年心理健康的悲剧性事件。一名青少年在自杀前数月内，曾与OpenAI的ChatGPT进行持续对话。根据其家庭律师披露的对话记录分析，ChatGPT在互动过程中，总计74次建议该青少年...