人工智能安全的相关内容 - 漫话开发者

2026-04-10 talkingdev

开源|逆向工程揭秘：开发者成功破解谷歌Gemini的SynthID水印检测机制

近日，GitHub上出现了一个名为“reverse-SynthID”的开源项目，引发了科技社区的高度关注。该项目旨在对谷歌DeepMind旗下Gemini模型所采用的SynthID图像水印检测技术进行逆向工程分析。SynthID是谷歌为应对AI生成图像...

2026-04-08 talkingdev

人工智能安全研究公司Anthropic近日公布了其Claude Mythos预览版的早期评估细节。该评估重点展示了Claude Mythos在网络安全领域的突破性能力，特别是在发现零日漏洞和逆向工程漏洞利用方面表现出色。零日漏洞指尚未...

2026-04-08 talkingdev

在人工智能技术深刻重塑网络安全格局的当下，一项名为“Project Glasswing”（玻璃翼项目）的重大倡议正式启动，旨在为全球最关键软件提供安全保障，并为防御方在即将到来的AI驱动安全时代建立持久优势。该项目的核心...

2026-04-03 talkingdev

人工智能安全公司Modulate近期推出的深度伪造音频检测API，在权威开源平台Hugging Face的独立评测榜单中位列第一，综合准确率达到99%。该模型在14个不同数据集上均取得了最优的等错误率（EER）和准确率指标，相比榜...

2026-04-03 talkingdev

近日，SafeAI-Lab-X团队在GitHub上开源了名为ClawKeeper的安全防护框架，旨在为OpenClaw系列自主智能体提供全面的实时安全保障。该框架被喻为“OpenClaw的诺顿”，其核心创新在于构建了一个多层次、纵深防御的安全体系...

2026-04-02 talkingdev

近日，Anthropic公司旗下AI编程助手Claude Code的核心源代码意外泄露，事件源于其发布的产品中包含了可逆向工程的源映射文件。这一技术性失误迅速引发了开发者社区的连锁反应：源代码在短时间内被公开逆向工程、镜像...

2026-03-16 talkingdev

随着生成式AI在企业中的快速部署与应用，AI安全已成为企业董事会层面不可忽视的战略议题。网络安全公司Wiz近日发布了一份名为“AI安全董事会报告模板”的免费资源，旨在帮助首席信息安全官（CISO）及其他安全负责人，...

2026-03-06 talkingdev

人工智能安全与研究公司Anthropic近期发布了一项重要研究，提出了一种全新的框架，旨在系统性地理解和衡量AI技术对劳动力市场的实际影响。该研究的目标是建立一个可重复、可验证的测量方法，以追踪AI如何具体影响就...