随着人工智能大模型规模的不断增长,模型评估(Eval)环节正在迅速演变为一个新的计算瓶颈,其成本在某些情况下甚至已经逼近甚至超过了模型训练的开销。根据最新的行业分析,一次全面的AI评估运行费用可能高达数万美...
Read More近日,一则关于Anthropic旗下AI编程工具Claude Code的严重Bug在开发者社区引发轩然大波。据GitHub Issue #53262报告,当用户在Git提交信息中写入“HERMES”一词时,Claude Code会错误地将本次请求路由至一个额外的、可...
Read More在人工智能领域,系统提示词(System Prompt)是塑造大型语言模型行为与输出的核心指令,通常被各大AI实验室视为高度机密。然而,Anthropic公司却独树一帜,成为唯一一家持续公开其面向用户的聊天系统(如Claude)完...
Read More近日,一篇关于Claude AI助手设计理念的深度分析文章在科技社区引发了广泛关注。文章作者Sam Henri Gold从用户体验、交互设计和伦理考量等多个维度,探讨了Claude作为人工智能助手在情感表达与理性思考之间的平衡艺...
Read More据《连线》杂志报道,人工智能领军企业OpenAI近日公开支持美国伊利诺伊州一项颇具争议的法案。该法案旨在为AI实验室提供广泛的法律责任豁免,即使其产品造成被定义为“重大损害”的后果——例如导致超过100人死亡或造成1...
Read More近日,GitHub上出现了一个名为“reverse-SynthID”的开源项目,引发了科技社区的高度关注。该项目旨在对谷歌DeepMind旗下Gemini模型所采用的SynthID图像水印检测技术进行逆向工程分析。SynthID是谷歌为应对AI生成图像...
Read More近日,科技界发生了一起备受关注的模型溯源事件。AI编程助手Cursor发布的新一代代码生成模型Composer 2,被用户发现其底层架构疑似基于中国人工智能公司月之暗面(Moonshot AI)的开源大模型Kimi 2.5。面对社区质疑...
Read More近日,一个托管在GitHub上的开源项目“DHS Contracts Explorer”引发了科技界与数据安全领域的广泛关注。该项目基于黑客入侵美国国土安全部(DHS)下属行业合作办公室(Office of Industry Partnership)所获取的数据...
Read More