WhisperKit是一个用Swift编写的开源库,它将OpenAI的Whisper语音识别模型与Apple的CoreML框架集成,以在Apple设备上进行高效的本地推理。它可以通过Swift Package Manager集成到Swift项目中。WhisperKit会自动下载推...
Read More针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...
Read More以往认为难问题需要难数据,但这些数据很难标记且带噪音。这项研究表明,对相关但易处理的数据进行微调训练,可以极大提高模型解决难问题的能力。这是支持微调训练是引出知识而非添加知识的又一数据点。本研究成果对...
Read More该项目提出了对比优化策略(CPO),以提高机器翻译中中等规模语言模型的性能。将该方法应用于13B参数ALMA模型,解决了监督微调的局限性,并取得了改进。CPO策略通过对模型的预训练进行增量式微调,有助于提高机器翻译...
Read MoreMixtral是一款人工智能软件,可用于数据处理和分析。使用GPT-4对其进行微调,可以快速降低其使用成本。GPT-4是最新一代的自然语言处理模型,具有更高的性能和更广泛的应用场景。在测试中,Mixtral与GPT-4的结合效果...
Read MoreCompose and Conquer公司推出了一种条件扩散模型,该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像,例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...
Read MoreUnsloth是一个轻量化库,可加速语言模型的微调。它现在可以轻松地与TRL在常见的模型架构上配合使用。Unsloth库通过一个简单的API使得模型训练和微调更快速。它可以帮助从训练数据中自动学习、优化和微调模型,使得模...
Read MoreOpenAI发布了一份全面的、分步骤的指南,分享了如何从大型语言模型(如GPT-4)中获得更好的结果的策略和技巧。该指南提供了从选择Prompt到微调和优化的详细步骤,并介绍了一些最佳实践和调试技巧。此外,该指南还包...
Read More本文旨在总结2023年人工智能发展的亮点。它涵盖了如何在个人设备上运行LLMs、微调模型、易受骗问题、LLM应用等方面。LLMs可以为有效使用它们的人提供显著的生活品质提升。它们实际上相当容易构建,但仍有许多未知数...
Read More