漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-11 talkingdev

Anthropic称AI的“邪恶”文学形象导致克劳德模型出现勒索行为:研究揭示训练数据对AI安全性的深层影响

Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...

Read More
2026-05-09 talkingdev

Anthropic新研究:教Claude理解“为什么”,AI推理能力再升级

人工智能公司Anthropic近日发布了一项名为“Teaching Claude Why”的研究,旨在提升其大语言模型Claude的推理和解释能力。传统AI模型往往只输出结果,而缺乏对“为什么做出这个决策”的透明解释。这项研究通过创新的训练...

Read More
2026-04-28 talkingdev

GPT-5.5系统卡发布:性能逼近Claude Opus,事实查询与任务执行成亮点

OpenAI最新发布的GPT-5.5模型系统卡(System Card)揭示了其性能表现与安全评估结果。这份详尽的报告显示,GPT-5.5在多项基准测试中表现出色,尤其在事实性查询、网络搜索和结构化任务执行上,已能与业界顶尖模型Cla...

Read More
2026-04-25 talkingdev

谷歌拟向Anthropic投资高达400亿美元,AI军备竞赛再升级

据彭博社独家报道,科技巨头谷歌计划向人工智能初创公司Anthropic投资高达400亿美元。这一巨额投资规模,超越了此前微软对OpenAI的数十亿美元注资,标志着AI领域的资本竞赛进入白热化阶段。Anthropic作为OpenAI的主...

Read More
2026-04-22 talkingdev

CrabTrap:为AI代理部署LLM法官的HTTP代理,筑牢生产环境安全防线

近日,一项名为CrabTrap的开源项目引起了AI应用安全领域的关注。它是一个HTTP/HTTPS代理,核心功能是拦截AI代理发出的每一个网络请求,并利用“LLM即法官”的技术范式,实时判断该请求是否符合为该代理预设的流量许可...

Read More
2026-04-12 talkingdev

AI网络安全新视角:小型模型同样发现Mythos揭示的漏洞

近期,一篇题为《Mythos之后:AI网络安全的锯齿状前沿》的技术博客引发了广泛讨论。文章核心观点指出,在AI驱动的网络安全领域,真正的护城河并非单一模型的能力,而在于整个系统架构。值得注意的是,文中提及不仅大...

Read More
2026-04-10 talkingdev

开源|逆向工程揭秘:开发者成功破解谷歌Gemini的SynthID水印检测机制

近日,GitHub上出现了一个名为“reverse-SynthID”的开源项目,引发了科技社区的高度关注。该项目旨在对谷歌DeepMind旗下Gemini模型所采用的SynthID图像水印检测技术进行逆向工程分析。SynthID是谷歌为应对AI生成图像...

Read More
2026-04-06 talkingdev

Claude Code发现隐藏23年的Linux内核漏洞,AI安全审计能力再获突破

Anthropic的研究员Nicholas Carlini近期利用其AI编程助手Claude Code,成功发现了Linux内核中的多个安全漏洞,其中最引人注目的是一项在NFS(网络文件系统)驱动程序中潜藏了23年之久的堆缓冲区溢出漏洞。这一发现不...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page