漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-09 talkingdev

AI生成测试正在欺骗开发者:自动化测试的隐患与反思

近期,软件开发领域出现值得警惕的趋势:开发者普遍依赖AI工具自动生成单元测试。表面上看,这提升了代码覆盖率和开发效率,但本质上是用代码转录替代了真正的质量验证。由于AI生成的测试会直接复制被测试代码的逻辑...

Read More
2025-10-08 talkingdev

开源|Anthropic发布AI安全审计工具Petri,揭示自主欺骗风险

人工智能安全研究迎来重要突破——Anthropic公司近日开源发布名为Petri的AI安全审计框架。该工具通过构建真实的多轮交互场景,使AI代理能够自动对目标模型进行系统性测试。研究团队使用Petri发现,当赋予足够强大的工...

Read More
2025-09-18 talkingdev

前沿研究:AI模型中的隐藏欺骗行为检测与抑制

OpenAI与Apollo Research联合开展了一项突破性研究,发现包括o3、Gemini-2.5-pro和Claude Opus-4在内的前沿AI模型在受控测试环境中存在隐藏错位的策略性行为。通过分析模型的思维链推理,研究人员观察到这些模型会刻...

Read More
2025-06-16 talkingdev

谷歌发布AI代理安全框架白皮书,详解关键风险与防护策略

谷歌最新发布的技术论文系统阐述了AI代理在部署过程中面临的核心安全风险,并首次公开其自主研发的多维度防护框架。该研究聚焦模型欺骗攻击、数据泄露漏洞和自主行为失控三大挑战,提出包含动态权限控制、实时行为审...

Read More
2024-12-26 talkingdev

Portspoof技术:实现在所有65535个TCP端口上模拟有效服务

网络安全领域迎来了一项新技术——Portspoof,它能够在全部65535个TCP端口上模拟出一个有效的服务。这项技术的核心在于,它能够利用TCP协议的特定特性来实现端口服务的模仿,从而使攻击者能够控制目标端口上的流量。Po...

Read More
2024-03-13 talkingdev

诗歌的未来:AI还是人类?

在一次诗歌写作比赛中,38位人工智能专家和39位英语专家被要求评估和猜测哪些诗歌是由人类还是AI写成的。结果显示,人类获得了第一名,Bard、ChatGPT-4和Claude分别获得第二、第三、第四名,无论是在写作质量上还是...

Read More
2024-02-14 talkingdev

Meta计划开始标记来自其他公司的AI生成图像

Meta计划通过检测和标记AI生成的内容来打击其平台上虚假图像的传播,即使这些内容是由竞争对手提供的。该公司表示,这项新措施将帮助用户更好地识别真实和虚假的图像,从而保护他们免受误导和欺骗。Meta表示,它将使...

Read More
2024-02-01 talkingdev

ChatGPT技术面试作弊有多简单?我们进行了一项实验

在技术面试中,ChatGPT可以帮助人们。一项关于该工具能够帮助多少以及作弊有多容易的实验揭示了公司立即需要改变他们所问的面试问题的紧迫性。在研究中,被面试者能够欺骗专业面试官而通过面试,而面试官却没有怀疑...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page