Lorax-多LoRA模型推理服务器开源 talkingdev • 2024-02-23 964281 views Lorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时,RAM内存占用会大幅减少。 核心要点 LoRA模型热插拔,RAM内存占用大幅减少 支持广泛的模型调整范围 MultiLora推理服务器现已在GitHub上发布 Read more > 查看原文