模型的相关内容 - 漫话开发者

2024-03-11 talkingdev

大型语言模型中的优化算法metaheuristics引入，有效优化prompt学习

本文介绍了元启发式算法，这是一种强大的工具，可用于改善大型语言模型中的prompt学习。元启发式算法是一组多样化的超过100种离散优化方法，可以大大提高大型语言模型的效率和性能。

2024-03-11 talkingdev

该项目采用翻译技术，针对多种语言的AI模型中的有害内容问题进行改进，从而提高安全性。由于直接数据缺乏，因此该项目解决了AI模型中的有害内容问题，为该领域的发展提供了新的思路。

2024-03-11 talkingdev

01.AI团队发布了一篇论文，详细介绍了Yi模型的数据收集和训练过程。Yi模型一直是最强大的开放语言模型之一。

2024-03-08 talkingdev

微软近日宣布向法国人工智能公司Mistral投资1500万欧元，这表明微软的战略是增强Azure的AI能力、在欧洲市场占领先机，并在欧盟的AI行动计划出台前加强其多元化战略。Azure旨在成为一个模范园地，提供各种人工智能模...

2024-03-08 talkingdev

Co-LLM推出了一种新方法，可以让大型语言模型协作，逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务，从而在遵循指令、特定领域问题和推理挑战等方面提高性能。

2024-03-08 talkingdev

DP3推出了一种先进的模仿学习方法，结合3D视觉数据和扩散策略，以高效的方式为机器人教授复杂技能。该方法通过将多个示教者的动作数据进行聚合，形成一个复杂的运动模型，并通过扩散过程来优化该模型。该模型可以有...

2024-03-08 talkingdev

这是一篇关于大规模模型训练的并行化技术的教程。文章详细介绍了不同类型的并行化技术，以及如何在训练大模型时实现高效的并行化。本文介绍了数据并行、模型并行和混合并行等不同的技术，并详细讨论了它们的优缺点。...

2024-03-08 talkingdev

评估语言模型通常采用手动策划的基准测试。其中一些基准测试非常大，有些超过14k个示例，这导致评估成本和噪声很高。这项工作表明，您可以可靠地评估流行基准测试中的语言模型性能，只需使用100个示例即可。