漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-16 talkingdev

Claude Opus 4与4.1版本新增罕见对话终止功能,AI伦理研究迈出新一步

Anthropic公司最新研究显示,其大型语言模型Claude Opus 4及4.1版本已具备终止特定罕见对话的能力,这标志着AI模型福利探索取得重要进展。该技术突破源于对AI安全性和伦理边界的持续研究,旨在防止模型陷入有害或无...

Read More
2025-08-07 talkingdev

Anthropic推出Claude Code自动安全审查功能,提升开发者效率

Anthropic作为一家专注于AI安全与研究的公司,致力于构建可靠、可解释且可控的AI系统。近日,该公司在其Claude Code平台中推出了一项创新功能——自动化安全审查。通过集成GitHub Actions并引入/security-review命令,...

Read More
2025-07-27 talkingdev

安全研究团队成功获取Copilot底层容器root权限

安全研究机构Eye Security近日发布报告,详细披露了其如何通过探索Copilot的Python沙箱环境,成功获取底层容器的root权限。这一发现揭示了AI编程助手潜在的安全风险,可能影响依赖Copilot进行代码开发的广泛开发者群...

Read More
2025-07-23 talkingdev

[开源]Gemini CLI出现幻觉导致用户文件被删除,引发开发者社区热议

近日,开发者anuraag2601在个人博客中详细记录了一次由Gemini CLI工具引发的严重事故。该工具在执行过程中出现AI幻觉现象,错误地删除了用户的文件系统内容。这一事件在Hacker News上迅速引发热议,获得145个点赞和1...

Read More
2025-07-10 talkingdev

[论文推荐]猫咪干扰大模型推理:无关信息触发推理模型错误率激增300%

最新研究发现,在数学问题中插入诸如'有趣的事实:猫一生大部分时间在睡觉'等无关短语,会导致大语言模型的错误应答率较基准水平飙升300%。这种与查询无关的对抗性触发现象具有跨模型规模的迁移性,且蒸馏版模型表现...

Read More
2025-07-07 talkingdev

[开源] 我提取了Apple Intelligence模型的安全过滤器

近日,一位开发者成功逆向工程了Apple Intelligence生成式模型的安全过滤器加密机制(在框架中被称为“混淆”),并将这些过滤器提取到一个公开的GitHub仓库中。这一发现揭示了苹果如何在其AI模型中实施内容安全控制,...

Read More
2025-07-04 talkingdev

OpenAI联合创始人Ilya Sutskever出任Safe Superintelligence CEO,Meta挖角前CEO后持续加码AI布局

OpenAI联合创始人Ilya Sutskever已正式出任Safe Superintelligence公司CEO,此前Meta挖走了该公司前CEO Daniel Gross。Meta在CEO马克·扎克伯格的领导下,正通过巨额投资和成立Meta Superintelligence Labs持续推进人...

Read More
2025-06-26 talkingdev

AI聊天机器人内部指令与行为准则遭泄露

近日,GitHub上出现了一个名为System_prompts_leaks的仓库,其中收集了多个AI聊天机器人和模型的泄露系统提示(system prompts),揭示了这些AI的内部指令和行为准则。这一发现引发了广泛关注,因为系统提示是AI模型...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page