SFT的相关内容 - 漫话开发者

2024-01-23 talkingdev

提升视觉基础模型性能：ViSFT开源

针对图像-文本训练中使用的视觉基础模型，研究人员提出了一种名为ViSFT的新方法，以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先，该模型使用大规模的无监督预训练来学习图像...

2024-01-09 talkingdev

有很多方式可以对齐语言模型，例如SFT、LoRa、RLHF、DPO、Prompting和Threatening。本研究提出使用负嵌入加到偏置项中，以将模型生成推向期望的结果。

2023-12-11 talkingdev

Mamba是一种非Transformer的模型，其性能惊人。它经过了SFT的聊天调优，并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。

2023-08-10 talkingdev

通过上传JSONL数据到你的云端硬盘，链接并运行带有QLoRA和SFT训练的笔记本，你就可以得到一个定制调整的Llama2模型。这似乎是我发现的最简单的调整例子，并且效果很好。最重要的是，该模型使用了（提示，响应）的格...