漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-22 talkingdev

利用真实世界知识提升语言模型表现:新的微调方法

研究人员设计了一种新方法,使用虚拟模拟器为语言模型提供“具身体验”,以培养其对真实世界的理解和规划能力。这种新方法显著提高了模型的能力,使得小型模型的表现与 ChatGPT 等大型模型相当甚至更好。 ## 三个核心...

Read More
2023-05-22 talkingdev

HuggingFace发布4位标准浮点数模型 (GitHub仓库)

HuggingFace发布了新的研究成果,使得在普通硬件上能够完成对65B参数模型的微调。这项研究使得量化技术不再局限于推理阶段,而是可以应用于训练过程中,从而大幅减少了模型所需空间。以下是该研究的三个核心点: -...

Read More
2023-05-19 talkingdev

FastComposer:高效个性化的多主题文本到图像生成技术

近日,研究人员开发出一种名为FastComposer的新方法,能够快速创建个性化的多主题图像,避免了其他方法中耗时的微调。不仅如此,FastComposer还能够处理多主题生成中的混合问题,并且可以更快地生成不同风格、动作和...

Read More
2023-05-10 talkingdev

把基础模型转化为聊天助手

Star coder是一个来自大型代码项目的出色新模型,它可以编写86种不同的编程语言。本文探讨了如何促使模型参与对话,如何使用聊天标记语言,甚至如何调整这些模型。对于那些有兴趣采取开源模型并为自己的基于聊天的用...

Read More
2023-05-09 talkingdev

百万美元AI微调挑战赛

**内容简介:** - Kaggle的微调语言模型类比赛 - 通过社区的协力,提高语言模型的安全性 - 提供计算资源合作和奖励机制 - 比赛将于6月10日开始 **核心要点:** - Kaggle平台为微调语言模型提供了竞赛机会 - 通过...

Read More
2023-05-02 talkingdev

Godot-Dodo

Godot-Dodo项目提出了一种流程,可以从GitHub检索人类创建的特定语言代码,并对开源语言模型进行微调。 以下是其核心要点: - Godot-Dodo项目致力于提高开源语言模型在特定语言领域中的表现力。 - 该项目使用GitHu...

Read More
2023-05-01 talkingdev

Lamini:快速定制模型的LLM引擎

Lamini是一款用于快速定制模型的LLM引擎。这个GitHub仓库包含一个7.1万条指令的数据集,用于微调指令跟随的LLM模型,Lamini的数据生成器和微调后的LLM模型。所有数据和LLM都具有商业使用许可。 以下是该新闻的三个...

Read More
2023-04-20 talkingdev

机器学习:使用视觉指令调整大型语言模型

本文介绍了一篇新的论文,提出使用机器生成的指令跟踪数据来调整大型语言模型(LLMs)以执行多模态任务。该论文开发了LLaVA,这是一个大型多模态模型,它结合了视觉编码器和仅限于语言的GPT-4。经过调整后,LLaVA展...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page