微调的相关内容 - 漫话开发者

2024-04-28 talkingdev

使用Unsloth微调Llama3：显著减少内存使用且长上下文增6倍

Llama3是一种革命性的新技术，它通过使用Unsloth进行微调，可以在保持相同的计算效率的同时，显著降低VRAM的使用量。最近的研究表明，使用Unsloth微调Llama3可以使上下文长度增长六倍，这比HF的flash attention技术...

2024-04-08 talkingdev

近期在GitHub上发布的ReFT（Representation Fine-Tuning）项目，为微调语言模型带来了一种新的参数高效方法。与传统的PeFT相比，ReFT在保持强大性能的同时，大大降低了成本。该方法通过精细化调整模型参数，使得在进...

2024-04-05 talkingdev

OpenAI最近宣布扩大其定制模型计划，通过辅助微调和定制训练模型，帮助企业客户开发适合特定使用场景的生成式AI模型。这一服务的推出，意味着企业可以根据自己的特定需求，获得更加个性化和高效的AI解决方案。生成式...

2024-04-03 talkingdev

YC支持的25家创业公司通过培训或微调自有的基础模型，打破了构建AI模型需要巨额资源的传统观念。这些公司在短时间内取得了显著成就，如创造专业音乐和设计新型蛋白质。这些公司利用YC的资金和技术支持，跨越不同领域...

2024-03-25 talkingdev

Mistral公司近期举办了一场黑客马拉松活动，并在此期间宣布了其7B语言模型的v0.2版本。同时，Mistral还发布了如何对其语言模型进行微调的代码。这些代码编写得整洁而简明，易于理解和使用。微调代码的发布，将有助于...

2024-03-22 talkingdev

近期，OpenAI推出了GPT-4的微调API，使用户能够创建一个定制版本的GPT-4。这一服务的优势在于，用户可以根据自己的特定需求调整模型，从而在性能上获得高达三倍的提升。不过，这一性能提升并非没有代价，相比于原版G...

2024-03-22 talkingdev

Meta公司近日发布了一个名为Torchtune的原生PyTorch库，专门用于精细调整语言模型。该库旨在为开发者提供更为便捷的工具，以便在PyTorch框架中进行语言模型的微调工作。通过Torchtune，开发者可以更容易地实现模型性...

2024-03-20 talkingdev

近日，GitHub上出现了一个新的项目LlamaGym，该项目专注于通过在线强化学习方法对大型语言模型（LLM）代理进行微调。大型语言模型在近年来取得了显著的进展，但如何进一步提升其性能，尤其是在特定任务上的表现，成...