Anthropic近日开源了名为Bloom的工具,这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率,能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...
Read More人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...
Read More人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展,标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力,实现实时问答、网页内...
Read More人工智能公司Anthropic近日宣布,正在Chrome浏览器中试点其AI助手Claude,旨在测试基于浏览器的AI能力,并为更广泛的发布构建必要的安全措施。此次试点的一个关键亮点是Claude与Claude Code的深度集成。Claude Code...
Read More在人工智能技术快速演进,特别是AI智能体(Agent)应用日益普及的背景下,一项旨在统一和扩展智能体能力的核心技术规范——Agent Skills,正式确立为开放标准。该标准最初由人工智能研究公司Anthropic(同时也是模型上...
Read More近日,一个名为Claude Mem的开源项目在GitHub上发布,为Anthropic公司的Claude Code编程助手插件带来了革命性的“持久记忆”能力。该插件能够自动捕获并记录Claude在编码会话中的所有操作与工具使用观察,随后利用AI技...
Read More英伟达近日正式发布了Nemotron 3系列开源模型,该家族包含Nano(300亿参数,30亿活跃参数)、Super(1000亿参数)和Ultra(5000亿参数)三个版本,其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是,当前...
Read More近日,一份基于人工智能深度分析生成的《非官方37signals/DHH Rails风格指南》在开发者社区引发关注。该指南并非由37signals官方发布,而是开发者利用Anthropic公司的Claude Code工具,对其开源项目管理工具Fizzy的...
Read More