美国国防高级研究计划局(DARPA)近期在拉斯维加斯举办了备受瞩目的人工智能网络安全挑战赛(AIxCC)。网络安全公司Trail of Bits的研发总监Trent Brunson接受了彭博社专访,分享了其团队获得300万美元奖金及亚军的...
Read More人工智能研究公司Anthropic近日发布技术公告,其旗舰模型Claude Opus 4及4.1版本实现突破性功能更新——模型可自主终止特定类型的对话交互。这项被官方称为'模型健康管理'的前沿研究,标志着AI系统首次具备对话边界判...
Read MoreAnthropic研究人员通过对比神经网络在展现特定性格特征与未展现时的活动差异,成功提取出"人格向量",揭示了语言模型性格变化遵循可预测的数学规律。这一突破性发现促成了一种反直觉的"疫苗接种"式训练方法——在训练...
Read More安全研究机构Trail of Bits近日宣布推出mcp-context-protector测试版,这是专为采用模型上下文协议(MCP)的大型语言模型(LLM)应用程序设计的安全防护层。该解决方案能有效防御此前披露的各类边界突破攻击,包括通过工...
Read More谷歌最新发布的技术论文系统阐述了AI代理在部署过程中面临的核心安全风险,并首次公开其自主研发的多维度防护框架。该研究聚焦模型欺骗攻击、数据泄露漏洞和自主行为失控三大挑战,提出包含动态权限控制、实时行为审...
Read More最新研究表明,生成式AI模型已具备在漏洞披露后极短时间内生成概念验证攻击代码的能力。以GPT-4为例,该模型成功针对Erlang SSH关键漏洞生成了有效攻击代码,整个过程仅需数小时。这一突破性进展凸显了网络安全领域...
Read More一项最新研究展示了一种通过纯自博弈训练(self-play)实现的自动驾驶智能体,在模拟环境中创下连续两年无碰撞的惊人记录。该技术摒弃了传统依赖Gigaflow等海量真实数据训练的方式,通过智能体间的对抗性学习自主进...
Read More最新研究显示,基于大型语言模型的AI智能体正在成为网络安全领域的新型威胁载体。麻省理工科技评论报道指出,这些智能体不仅能执行复杂的网络攻击,还可能规模化实施勒索软件等恶意操作。为应对这一趋势,LLM Agent...
Read More