漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-15 talkingdev

为何你的老板不担心AI:揭秘AI漏洞与常规软件缺陷的本质差异

当前公众对软件漏洞的认知存在关键误区——传统软件的缺陷源于代码错误,可通过精确定位实现彻底修复;而AI系统的脆弱性则根植于海量训练数据,导致错误源头难以追溯或完全消除。这一差异揭示了AI安全的根本挑战:传统...

Read More
2025-10-15 talkingdev

开源|Petri:AI对齐研究新突破,分钟级完成假设测试的审计智能体

由安全研究团队推出的开源项目Petri,标志着人工智能对齐领域取得重要技术突破。该工具作为专为现实场景设计的对齐审计智能体,彻底改变了传统验证流程——研究人员无需耗费数周构建定制化评估体系,即可在几分钟内完...

Read More
2025-09-30 talkingdev

加州签署AI透明度法案,全球人工智能治理迈出关键一步

美国加利福尼亚州州长加文·纽森于2025年9月29日正式签署SB-53法案,这项具有里程碑意义的立法将强制要求人工智能系统在生成内容时进行明确标识。该法案作为全球首个针对AI生成内容的强制性披露法规,要求开发者和部...

Read More
2025-09-28 talkingdev

美国在联合国拒绝AI治理国际合作倡议,多国呼吁紧急协同应对风险

在联合国大会上,人工智能治理成为焦点议题。尽管多国领导人和全球专家强调AI技术带来的巨大机遇与潜在风险,并呼吁建立紧急国际协作机制,但美国代表却表达了坚决反对立场。这一事件凸显了全球在AI监管路径上的深刻...

Read More
2025-09-22 talkingdev

全球AI监管政策激增30%至1300余项,但OECD报告显示国际合作陷入停滞

根据经济合作与发展组织(OECD)最新数据,截至2025年9月,全球人工智能相关法规、指南和政策总量已突破1300项,较2022年增长约30%。这份涵盖主要经济体的统计显示,美国、欧盟及亚太地区近年来密集出台AI治理框架,...

Read More
2025-09-14 talkingdev

独家专访AI风险预警先驱尤德科夫斯基:新书剖析人工智能利弊与理性主义哲学

《纽约时报》科技记者凯文·鲁斯对人工智能安全领域先驱研究者埃利泽·尤德科夫斯基进行了深度专访。作为最早提出AI存在生存性风险的研究者之一,尤德科夫斯基在过去20年间持续向AI行业内部发出预警,如今他通过新书向...

Read More
2025-08-28 talkingdev

OpenAI与Anthropic达成AI安全互测协议,共筑行业安全新标准

OpenAI与Anthropic近日达成一项突破性合作,双方开放内部API接口进行交叉安全测试,旨在通过第三方视角发现彼此模型评估中的盲点。这一举措标志着AI行业从封闭式自查向开放式协作安全验证的重要转变。通过技术互鉴,...

Read More
2025-06-16 talkingdev

谷歌发布AI代理安全框架白皮书,详解关键风险与防护策略

谷歌最新发布的技术论文系统阐述了AI代理在部署过程中面临的核心安全风险,并首次公开其自主研发的多维度防护框架。该研究聚焦模型欺骗攻击、数据泄露漏洞和自主行为失控三大挑战,提出包含动态权限控制、实时行为审...

Read More
  1. Next Page