《纽约时报》科技记者凯文·鲁斯对人工智能安全领域先驱研究者埃利泽·尤德科夫斯基进行了深度专访。作为最早提出AI存在生存性风险的研究者之一,尤德科夫斯基在过去20年间持续向AI行业内部发出预警,如今他通过新书向...
Read More随着人工智能代理技术日益渗透日常生活,其直接控制个人设备所引发的安全隐患正成为科技界焦点问题。最新行业分析指出,当前AI代理系统普遍存在权限控制粒度不足的缺陷,可能导致密码、API密钥等敏感信息暴露风险。...
Read More提示注入攻击正成为大型语言模型面临的新型安全威胁,这种攻击通过操纵自然语言处理能力来利用系统漏洞,其原理类似于传统的SQL注入攻击。研究人员最新提出了六种核心设计模式来强化AI智能体的安全防护:行动选择器...
Read More网络安全研究团队近日公开了名为AgentHopper的概念验证型AI病毒,这是一种基于条件提示注入(Conditional Prompt Injection)技术的跨智能体攻击载荷。该病毒通过针对性操纵AI代理的行为逻辑,实现在不同AI系统间的...
Read More生成式AI正将金融欺诈推向工业化运作新阶段。最新研究显示,语音克隆仅需1小时YouTube素材和11美元订阅服务即可实现,合成身份欺诈已使银行年损60亿美元。传统防御机制难以应对AI驱动的自动化攻击,包括凭证填充攻击...
Read More美国国防高级研究计划局(DARPA)近期在拉斯维加斯举办了备受瞩目的人工智能网络安全挑战赛(AIxCC)。网络安全公司Trail of Bits的研发总监Trent Brunson接受了彭博社专访,分享了其团队获得300万美元奖金及亚军的...
Read More人工智能研究公司Anthropic近日发布技术公告,其旗舰模型Claude Opus 4及4.1版本实现突破性功能更新——模型可自主终止特定类型的对话交互。这项被官方称为'模型健康管理'的前沿研究,标志着AI系统首次具备对话边界判...
Read MoreAnthropic研究人员通过对比神经网络在展现特定性格特征与未展现时的活动差异,成功提取出"人格向量",揭示了语言模型性格变化遵循可预测的数学规律。这一突破性发现促成了一种反直觉的"疫苗接种"式训练方法——在训练...
Read More