Anthropic近日开源了名为Bloom的工具,这是一个专门用于对AI模型进行自动化行为评估的开源解决方案。该工具通过创建特定场景并量化不同模型中的行为发生率,能够系统性地评估如自我偏好偏见、蓄意破坏等具体行为模式...
Read More人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...
Read More人工智能公司Anthropic近日正式发布了“Claude in Chrome”浏览器扩展,标志着其旗舰AI助手Claude进一步向日常生产力工具渗透。该扩展允许用户直接在Chrome浏览器中调用Claude的对话与推理能力,实现实时问答、网页内...
Read More据路透社援引知情人士消息,专注于人工智能训练领域的芯片制造商Cerebras Systems正计划重启其首次公开募股进程。该公司预计最快将于下周向美国证券交易委员会提交IPO申请,目标是在2026年第二季度完成上市。此举标...
Read More在AI驱动编程工具竞争日益激烈的背景下,一项重要的行业整合事件引发了开发者社区的广泛关注。专注于代码审查与协作的初创公司Graphite近日正式宣布,将加入由知名AI代码助手Cursor构建的生态系统。Cursor凭借其深度...
Read More知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...
Read More在移动设备交互设计领域,传统的拖拽操作常因屏幕空间有限、手指遮挡和精准定位困难而体验不佳。近日,一个名为picknplace.js的开源JavaScript库提出了一种全新的交互范式,旨在从根本上优化这一用户体验。该库摒弃...
Read More人工智能公司Anthropic近日宣布,正在Chrome浏览器中试点其AI助手Claude,旨在测试基于浏览器的AI能力,并为更广泛的发布构建必要的安全措施。此次试点的一个关键亮点是Claude与Claude Code的深度集成。Claude Code...
Read More