微调的相关内容 - 漫话开发者

2023-08-30 talkingdev

开源工具DSPy：可提升语言模型的理解和学习能力

GitHub近日发布了新工具DSPy，这是一套简洁的Python模块集，能够统一调动和微调语言模型(LMs)的技术，并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现，同时也使得...

2023-08-25 talkingdev

近日，一款新的工具引发了业界的广泛关注。这款工具可以自动化gpt-3.5-turbo的调优过程，用户只需一键操作，即可使用本地磁盘上的文件进行调优。这一技术的出现无疑为大数据处理和人工智能的发展带来了新的可能性。...

2023-08-24 talkingdev

在生产环境中部署扩散模型一直是一个挑战，因为这些模型难以处理，且计算成本高。但是现在，OneDiffusion的出现旨在使部署和微调变得更易于管理、可扩展且可靠。OneDiffusion是一个开源项目，它的目标是使扩散模型在...

2023-08-23 talkingdev

您现在可以在自定义数据上微调gpt-3.5-turbo模型了。微调后的模型完全属于您，且不会利用您的数据训练其他模型。这种方法可以大大降低成本、提升控制性，并改善整体性能。此外，GPT-4的微调功能也将在今年秋季推出。

2023-08-21 talkingdev

对于大多数大型语言模型（LLM）应用，微调并非必要。使用少量提示或检索增强生成（RAG）可能是更好的选择。少量提示是指向LLM提供期望输出的示例，而RAG则涉及查询向量数据库，获取LLM未经训练的信息。这意味着，我...

2023-08-19 talkingdev

轩辕是国内首个开源的千亿级中文对话大模型，同时也是首个针对中文金融领域优化的千亿级开源对话大模型。轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调，它不仅可以应对通用领域的...

2023-08-18 talkingdev

LoRA，全称低阶适配器，可以帮助改变模型性能。这意味着，你不需要对模型中的每个参数进行微调，只需训练一个可以轻松插入的子集。在这种情况下，社区中训练了许多可以改变SDXL行为的LoRA。这个空间可以帮助你探索其...

2023-08-15 talkingdev

随着越来越多的云服务提供商为AI工作负载提供微调或服务，人们往往很难决定选择哪一个。这里提供了一套相当不错的启发式规则，帮助您决定在哪个云上运行您的任务。在选择云服务提供商时，您应首先考虑您的具体需求，...