Anthropic近日开源了名为Bloom的工具,这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率,能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...
Read More人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...
Read More人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展,标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力,实现实时问答、网页内...
Read More据TechCrunch报道,由前Splunk高管创立的初创公司Resolve AI,已成功完成A轮融资。此轮融资引人注目的亮点在于其采用了多层级估值方案,其中最高估值层级达到了10亿美元。Resolve AI的核心产品是一款旨在实现自主化...
Read More知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...
Read More近日,GitHub上开源项目Metacode引发开发者社区关注。该项目旨在解决代码注释的机器可读性问题,提出了一种基于Python语法的标准语言规范,并提供了开箱即用的解析器。这一创新类似于Python生态中各类源码分析工具(...
Read More近日,一个名为Claude Mem的开源项目在GitHub上发布,为Anthropic公司的Claude Code编程助手插件带来了革命性的“持久记忆”能力。该插件能够自动捕获并记录Claude在编码会话中的所有操作与工具使用观察,随后利用AI技...
Read More彭博社记者Mishal Husain近期对微软人工智能首席执行官穆斯塔法·苏莱曼进行了深度访谈,探讨了人工智能领域的前沿议题。苏莱曼阐述了其对“超级智能”的定义,即超越人类在所有认知任务上能力的通用人工智能系统。他特...
Read More