Nous Research运用Yarn方法,将Mistral 7B模型扩大到128k上下文
talkingdev • 2023-11-03
1286660 views
Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。
talkingdev • 2023-11-03
1286660 views
Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。