微调的相关内容 - 漫话开发者

2024-04-05 talkingdev

OpenAI推出定制化模型训练服务助力企业打造专属生成式AI模型

OpenAI最近宣布扩大其定制模型计划，通过辅助微调和定制训练模型，帮助企业客户开发适合特定使用场景的生成式AI模型。这一服务的推出，意味着企业可以根据自己的特定需求，获得更加个性化和高效的AI解决方案。生成式...

2024-04-03 talkingdev

YC支持的25家创业公司通过培训或微调自有的基础模型，打破了构建AI模型需要巨额资源的传统观念。这些公司在短时间内取得了显著成就，如创造专业音乐和设计新型蛋白质。这些公司利用YC的资金和技术支持，跨越不同领域...

2024-03-25 talkingdev

Mistral公司近期举办了一场黑客马拉松活动，并在此期间宣布了其7B语言模型的v0.2版本。同时，Mistral还发布了如何对其语言模型进行微调的代码。这些代码编写得整洁而简明，易于理解和使用。微调代码的发布，将有助于...

2024-03-22 talkingdev

近期，OpenAI推出了GPT-4的微调API，使用户能够创建一个定制版本的GPT-4。这一服务的优势在于，用户可以根据自己的特定需求调整模型，从而在性能上获得高达三倍的提升。不过，这一性能提升并非没有代价，相比于原版G...

2024-03-22 talkingdev

Meta公司近日发布了一个名为Torchtune的原生PyTorch库，专门用于精细调整语言模型。该库旨在为开发者提供更为便捷的工具，以便在PyTorch框架中进行语言模型的微调工作。通过Torchtune，开发者可以更容易地实现模型性...

2024-03-20 talkingdev

近日，GitHub上出现了一个新的项目LlamaGym，该项目专注于通过在线强化学习方法对大型语言模型（LLM）代理进行微调。大型语言模型在近年来取得了显著的进展，但如何进一步提升其性能，尤其是在特定任务上的表现，成...

2024-03-13 talkingdev

谷歌正在为Gemini Web应用程序推出一项新功能，允许用户使用重新生成、更短、更长和删除等选项微调AI生成的响应，目的是提供对创意内容更大的控制。

2024-03-08 talkingdev

Answer AI发布了一款新的FSDP/QLoRA训练工具，可在消费级GPU上训练70B参数模型。该公司开源了代码，并使其易于本地运行或在runpod上运行。