漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-11 talkingdev

大型语言模型中的优化算法metaheuristics引入,有效优化prompt学习

本文介绍了元启发式算法,这是一种强大的工具,可用于改善大型语言模型中的prompt学习。元启发式算法是一组多样化的超过100种离散优化方法,可以大大提高大型语言模型的效率和性能。

Read More
2024-03-11 talkingdev

论文:AI翻译技术应用于语言模型,解决有害内容问题

该项目采用翻译技术,针对多种语言的AI模型中的有害内容问题进行改进,从而提高安全性。由于直接数据缺乏,因此该项目解决了AI模型中的有害内容问题,为该领域的发展提供了新的思路。

Read More
2024-03-11 talkingdev

01.AI发布Yi开放基础模型

01.AI团队发布了一篇论文,详细介绍了Yi模型的数据收集和训练过程。Yi模型一直是最强大的开放语言模型之一。

Read More
2024-03-08 talkingdev

微软投资法国Mistral公司,为Azure增加AI能力,但并未放弃OpenAI合作

微软近日宣布向法国人工智能公司Mistral投资1500万欧元,这表明微软的战略是增强Azure的AI能力、在欧洲市场占领先机,并在欧盟的AI行动计划出台前加强其多元化战略。Azure旨在成为一个模范园地,提供各种人工智能模...

Read More
2024-03-08 talkingdev

CoLLM-通过协作提高LLM性能

Co-LLM推出了一种新方法,可以让大型语言模型协作,逐标记生成文本。这种策略允许模型利用其独特的优势和专业知识来完成各种任务,从而在遵循指令、特定领域问题和推理挑战等方面提高性能。

Read More
2024-03-08 talkingdev

DP3引领机器人模仿学习新方向

DP3推出了一种先进的模仿学习方法,结合3D视觉数据和扩散策略,以高效的方式为机器人教授复杂技能。该方法通过将多个示教者的动作数据进行聚合,形成一个复杂的运动模型,并通过扩散过程来优化该模型。该模型可以有...

Read More
2024-03-08 talkingdev

深入探讨:大规模模型训练的并行化技术

这是一篇关于大规模模型训练的并行化技术的教程。文章详细介绍了不同类型的并行化技术,以及如何在训练大模型时实现高效的并行化。本文介绍了数据并行、模型并行和混合并行等不同的技术,并详细讨论了它们的优缺点。...

Read More
2024-03-08 talkingdev

小型基准测试:用更少的示例评估LLM

评估语言模型通常采用手动策划的基准测试。其中一些基准测试非常大,有些超过14k个示例,这导致评估成本和噪声很高。这项工作表明,您可以可靠地评估流行基准测试中的语言模型性能,只需使用100个示例即可。

Read More
  1. Prev Page
  2. 296
  3. 297
  4. 298
  5. Next Page