漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

近日,Liquid AI宣布推出其最新基础模型LFM2.5-230M,这是一款参数规模仅为2.3亿的非Transformer架构模型。与当前主流的Transformer模型不同,LFM2.5-230M基于状态空间模型与液态神经网络连续时间公式构建。尽管体积极其紧凑,该模型在核心边缘推理与序列生成基准测试中,性能与规模大三倍的Transformer模型持平。这一突破意味着,在资源受限的边缘设备上,LFM2.5-230M能够在保持高效能的同时,实现低成本部署。该模型采用开源权重的方式发布,支持微调、工具调用及数据提取等多种边缘应用场景,为工业自动化和物联网设备带来了全新的轻量级AI解决方案。Liquid AI强调,这一架构创新有望在保持模型精度的前提下,显著降低计算资源与功耗需求,推动AI在更广泛硬件平台上落地。

核心要点

  • LFM2.5-230M采用非Transformer架构,基于状态空间与液态神经网络连续时间公式,实现模型轻量化。
  • 在边缘推理和序列生成基准测试中,其性能与三倍规模的Transformer模型持平,兼顾效率与准确性。
  • 开源权重发布,支持微调、工具使用与数据提取,适用于边缘部署和物联网等资源受限场景。

Read more >