微调的相关内容 - 漫话开发者

2024-01-23 talkingdev

提升视觉基础模型性能：ViSFT开源

针对图像-文本训练中使用的视觉基础模型，研究人员提出了一种名为ViSFT的新方法，以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先，该模型使用大规模的无监督预训练来学习图像...

2024-01-22 talkingdev

以往认为难问题需要难数据，但这些数据很难标记且带噪音。这项研究表明，对相关但易处理的数据进行微调训练，可以极大提高模型解决难问题的能力。这是支持微调训练是引出知识而非添加知识的又一数据点。本研究成果对...

2024-01-21 talkingdev

该项目提出了对比优化策略(CPO)，以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型，解决了监督微调的局限性，并取得了改进。CPO策略通过对模型的预训练进行增量式微调，有助于提高机器翻译...

2024-01-20 talkingdev

Mixtral是一款人工智能软件，可用于数据处理和分析。使用GPT-4对其进行微调，可以快速降低其使用成本。GPT-4是最新一代的自然语言处理模型，具有更高的性能和更广泛的应用场景。在测试中，Mixtral与GPT-4的结合效果...

2024-01-20 talkingdev

Compose and Conquer公司推出了一种条件扩散模型，该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像，例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

2024-01-12 talkingdev

Unsloth是一个轻量化库，可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型，使得模...

2024-01-08 talkingdev

OpenAI发布了一份全面的、分步骤的指南，分享了如何从大型语言模型（如GPT-4）中获得更好的结果的策略和技巧。该指南提供了从选择Prompt到微调和优化的详细步骤，并介绍了一些最佳实践和调试技巧。此外，该指南还包...

2024-01-03 talkingdev

本文旨在总结2023年人工智能发展的亮点。它涵盖了如何在个人设备上运行LLMs、微调模型、易受骗问题、LLM应用等方面。LLMs可以为有效使用它们的人提供显著的生活品质提升。它们实际上相当容易构建，但仍有许多未知数...