人工智能模型评估机构METR发布的最新数据显示,Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架,Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟,...
Read More在AI驱动编程工具竞争日益激烈的背景下,一项重要的行业整合事件引发了开发者社区的广泛关注。专注于代码审查与协作的初创公司Graphite近日正式宣布,将加入由知名AI代码助手Cursor构建的生态系统。Cursor凭借其深度...
Read More知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型(LLM)领域范式变革的年度回顾文章,引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...
Read More一个名为“History LLMs”的开源项目在技术社区引发了广泛关注。该项目旨在训练迄今为止规模最大的、专门基于1913年之前历史文本的大型语言模型。其核心构想是通过构建一个纯净的“前现代”语料库——即排除所有1913年之后...
Read MoreOpenAI官方宣布,开发者现已可以向ChatGPT提交应用程序以供审核和发布。这一举措标志着ChatGPT平台正式向第三方开发者开放其应用生态,用户将能够在即将上线的应用目录中发现和体验各类由开发者构建的AI应用。此举不...
Read More据技术观察者Simon Willison在其博客中披露,OpenAI已在ChatGPT和Codex模型中低调整合了竞争对手Anthropic于去年十月推出的“技能”(Skills)机制。这一机制的核心在于,它允许AI模型直接调用外部工具或API来执行特定...
Read More人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2,该模型被定位为专为专业知识工作和长期运行的智能体(agents)而设计的最先进系统。根据官方介绍,GPT-5.2在多个关键领域树立了新的性能标杆,包括代码生...
Read More根据最新市场监测数据,2025年11月企业级人工智能(AI)的采用率稳定在45%,增长势头出现明显停滞。这一现象在金融和科技这两个传统上对新技术最为敏感的行业尤为突出,其采用率甚至出现了轻微下滑。值得关注的是,...
Read More