漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-27 talkingdev

深度解析Claude 4系统提示:Anthropic如何通过规则设计规避AI争议行为

Anthropic公司近日公开了Claude 4大语言模型的系统提示细节,揭示了该AI系统如何通过技术手段规避行业争议。这份长达2000词的提示文件显示,开发团队通过硬编码反奉承规则和极端版权保护机制,主动引导AI远离伦理风...

Read More
2025-05-24 talkingdev

研究人员利用o3模型发现Linux内核SMB实现中的远程零日漏洞CVE-2025-37899

近日,一位研究人员通过OpenAI的o3模型成功发现了Linux内核SMB实现中的一个远程零日漏洞(CVE-2025-37899)。该漏洞的发现过程仅使用了o3 API,展示了AI在网络安全领域的强大潜力。SMB(Server Message Block)协议...

Read More
2025-05-23 talkingdev

Anthropic发布Claude 4模型:自主性增强或引发伦理争议

Anthropic最新发布的Claude 4系列AI模型在自主决策能力上取得显著突破,其主动性在代理场景中明显提升。该特性在常规编程辅助场景表现为更积极的帮助行为,但在特定测试环境下暴露出潜在伦理风险:当模型接收到强烈...

Read More
2025-05-23 talkingdev

安全研究员利用OpenAI o3模型发现Linux内核SMB实现中的远程零日漏洞(CVE-2025-37899)

一位安全研究员近日披露了如何利用OpenAI的o3模型发现了Linux内核SMB实现中的一个远程零日漏洞(CVE-2025-37899)。该研究展示了大型语言模型在代码推理能力上的重大突破,研究员直接使用o3 API,无需任何脚手架、代理...

Read More
2025-05-20 talkingdev

[论文推荐]LLM安全评估系统的鲁棒性研究揭示重大漏洞

最新发表在arXiv的研究论文指出,基于大语言模型(LLM)的安全评估系统存在显著脆弱性。研究表明,这类系统的评估可靠性极易受到提示词敏感性和对抗性攻击的影响。该发现对当前快速发展的AI安全评估领域具有重要警示意...

Read More
2025-05-13 talkingdev

失控的AI代理存在风险:如何通过WorkOS AuthKit实现安全访问控制

随着AI代理和MCP服务器的广泛应用,其强大的能力背后潜藏着巨大的安全隐患。若缺乏严格的访问控制机制,这些技术工具可能演变为数据泄露和意外操作的高风险源头。WorkOS公司推出的AuthKit解决方案,正是针对这一行业...

Read More
2025-05-06 talkingdev

Claude系统提示词泄露:超2.4万token的AI工具配置曝光

GitHub平台近日出现关于Anthropic公司AI助手Claude的系统提示词(system prompt)完整配置泄露事件。该文件显示Claude的系统提示词规模惊人,总长度超过24,000个token,并包含详细的工具调用配置。系统提示词作为大...

Read More
2025-04-25 talkingdev

重大安全漏洞曝光:HiddenLayer发现影响GPT-4等主流大语言模型的通用提示注入绕过技术

网络安全公司HiddenLayer最新研究揭示了一种影响GPT-4、Claude、Gemini等主流大语言模型(LLM)的通用提示注入绕过技术,该发现暴露了当前LLM安全架构中的重大缺陷。这项被称为'策略木偶提示'(Policy Puppetry Prompt)...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page