最新理论框架将人工智能划分为三个核心认知维度:工具、代理和模拟器。作为工具时,AI严格遵循人类指令延伸能力边界;代理形态下则具备自主目标追求能力;而模拟器模式专精于无特定目标的流程仿真。研究表明,大型语...
Read More艾伦人工智能研究所(Allen Institute for AI)近日发布了OLMo-2-1B语言模型,这是一款参数规模为1B的小型开源模型。该项目的突破性意义在于其完全透明的训练范式:研究团队不仅公开了模型权重,还完整披露了训练数...
Read MoreAI可解释性领域领军企业Goodfire近日宣布完成5000万美元A轮融资。该公司在稀疏自编码器(SAEs)等机械可解释性技术上具有深厚积累,致力于通过与闭源及开源模型提供方的深度合作,系统性地解析、引导和控制AI模型的...
Read More随着人工智能技术的飞速发展,大型语言模型(LLM)的复杂性和能力不断提升,但其内部决策过程仍被视为“黑箱”。近日,研究人员通过先进的追踪技术,成功揭示了LLM在生成文本时的思维路径。这一突破不仅有助于提升模型...
Read More该版本专注于通过稀疏自编码器技术增强机器学习模型的可解释性。Llama项目是一个开放源代码的机器学习框架,旨在使复杂的模型更加易于理解和解释。在Llama 3.2中,开发者们引入了稀疏自编码器技术,该技术通过学习输...
Read MoreAnthropic的研究人员近日公布了一种解读其大型语言模型Claude Sonnet内部运作的新方法。他们通过绘制出数百万个与各种概念相对应的特征,成功解析了这个模型的内在机制。这一可解释性研究不仅有助于我们更好地理解AI...
Read More