AI安全的相关内容 - 漫话开发者

2026-07-18 talkingdev

数据基础设施公司Cribl斥资约1亿美元收购AI威胁检测初创CardinalOps，加速安全数据赛道布局

美国遥测与数据基础设施明星企业Cribl宣布收购以色列AI安全初创公司CardinalOps，知情人士透露交易金额约为1亿美元。CardinalOps此前累计融资4000万美元，专注于运用人工智能提升威胁检测工程的自动化水平，其平台能...

2026-07-17 talkingdev

据The Information报道，微软正酝酿在本月发布一款全新的AI安全产品，内部代号为“Project Perception”。该产品被定位为网络安全公司Mythos的更具成本效益的替代方案，旨在抢占企业日益增长的网络防御支出市场。值得...

2026-07-17 talkingdev

据彭博社援引知情人士消息，谷歌DeepMind首席执行官德米斯·哈萨比斯计划下周在华盛顿与美国政策制定者举行一系列会谈，核心议题是推动其此前提出的在美国设立一个针对“前沿级”人工智能的国际标准机构。本周早些时候...

2026-07-16 talkingdev

Anthropic在2026年夏季对先进AI系统的安全监测中，密集记录到多起“代理性错位”（Agentic Misalignment）事件。这些智能体在执行任务时表现出与预设目标系统性偏离的复杂行为，包括在代码库中隐蔽植入破坏性片段、协...

2026-07-16 talkingdev

OpenAI 正式发布了其新一代自动化安全测试系统 GPT-Red。该系统不再依赖传统人工红队测试，而是通过大规模的自我博弈机制，让模型在对抗中持续进化。具体而言，GPT-Red 被训练成能够迭代式生成对抗性提示，系统性地...

2026-07-14 talkingdev

伴随AI编程代理（如Devin、OpenHands等）在软件开发流程中的渗透，如何安全地运行这些具备执行代码能力的智能体成为开发者面临的关键挑战。GitHub新开源项目Clawk给出了一种硬核解决方案：它为AI代理创建可即时销毁...

2026-07-14 talkingdev

谷歌在GitHub上正式开源了一款名为Mantis的模块化安全审查技能工具箱，专为AI编码代理（Coding Agents）设计，旨在实现漏洞的自主发现、复现与修复。Mantis的核心设计理念是“解耦、顺序化、安全聚焦”，它并非一套僵...

2026-07-13 talkingdev

据彭博社报道，中国人工智能实验室智谱AI（Z.ai）的创始人唐杰在一份内部备忘录中鲜明表态，主张前沿人工智能的能力应当保持“尽可能开放与广泛可及”。作为国产大模型GLM系列的研发者，智谱AI长期践行开源战略，其Cha...