漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-18 talkingdev

专访Trail of Bits研发总监:DARPA人工智能网络安全挑战赛亚军团队背后的故事

美国国防高级研究计划局(DARPA)近期在拉斯维加斯举办了备受瞩目的人工智能网络安全挑战赛(AIxCC)。网络安全公司Trail of Bits的研发总监Trent Brunson接受了彭博社专访,分享了其团队获得300万美元奖金及亚军的...

Read More
2025-08-17 talkingdev

Claude Opus 4.1重大升级:AI模型首次具备主动终止特定对话能力

人工智能研究公司Anthropic近日发布技术公告,其旗舰模型Claude Opus 4及4.1版本实现突破性功能更新——模型可自主终止特定类型的对话交互。这项被官方称为'模型健康管理'的前沿研究,标志着AI系统首次具备对话边界判...

Read More
2025-08-04 talkingdev

Anthropic研究:人格向量技术实现语言模型性格特征的监测与控制

Anthropic研究人员通过对比神经网络在展现特定性格特征与未展现时的活动差异,成功提取出"人格向量",揭示了语言模型性格变化遵循可预测的数学规律。这一突破性发现促成了一种反直觉的"疫苗接种"式训练方法——在训练...

Read More
2025-07-29 talkingdev

Trail of Bits推出MCP协议安全层mcp-context-protector,防御LLM应用攻击

安全研究机构Trail of Bits近日宣布推出mcp-context-protector测试版,这是专为采用模型上下文协议(MCP)的大型语言模型(LLM)应用程序设计的安全防护层。该解决方案能有效防御此前披露的各类边界突破攻击,包括通过工...

Read More
2025-06-16 talkingdev

谷歌发布AI代理安全框架白皮书,详解关键风险与防护策略

谷歌最新发布的技术论文系统阐述了AI代理在部署过程中面临的核心安全风险,并首次公开其自主研发的多维度防护框架。该研究聚焦模型欺骗攻击、数据泄露漏洞和自主行为失控三大挑战,提出包含动态权限控制、实时行为审...

Read More
2025-04-23 talkingdev

AI模型可在漏洞披露后数小时内生成概念验证攻击代码

最新研究表明,生成式AI模型已具备在漏洞披露后极短时间内生成概念验证攻击代码的能力。以GPT-4为例,该模型成功针对Erlang SSH关键漏洞生成了有效攻击代码,整个过程仅需数小时。这一突破性进展凸显了网络安全领域...

Read More
2025-04-22 talkingdev

[论文推荐] 自博弈训练实现突破:自动驾驶智能体实现两年无事故模拟

一项最新研究展示了一种通过纯自博弈训练(self-play)实现的自动驾驶智能体,在模拟环境中创下连续两年无碰撞的惊人记录。该技术摒弃了传统依赖Gigaflow等海量真实数据训练的方式,通过智能体间的对抗性学习自主进...

Read More
2025-04-07 talkingdev

AI智能体将成为网络安全新威胁:LLM Agent Honeypot项目揭示攻击演化趋势

最新研究显示,基于大型语言模型的AI智能体正在成为网络安全领域的新型威胁载体。麻省理工科技评论报道指出,这些智能体不仅能执行复杂的网络攻击,还可能规模化实施勒索软件等恶意操作。为应对这一趋势,LLM Agent...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page