漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-27 talkingdev

论文:LLM模型中的4位量化技术

本研究介绍了LLM-FP4,这是一种新的方法,通过在训练后将大型语言模型的权重和操作转换为4位浮点值来压缩它们。近年来,由于NLP任务的快速发展,语言模型的大小和计算需求不断增加,这给模型的部署和使用带来了很多...

Read More
2023-10-26 talkingdev

SpellTest:基于Github的AI-to-AI测试

SpellTest是基于Github的一个新项目,旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法,常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误,并自动...

Read More
2023-10-25 talkingdev

AgentTuning:通过多个智能体任务中的交互轨迹来调整LLMs

近日,研究人员开源了名为AgentTuning的GitHub仓库。该仓库提供了一种新的方法来调整语言模型。这种方法通过多个智能体任务中的交互轨迹来训练和调整语言模型,从而更好地适应不同的任务和场景。这种方法可以提高语...

Read More
2023-10-25 talkingdev

cola,利用视觉语言模型增强视觉推理

Cola是一个使用大型语言模型来协调各种视觉语言模型(VLM)以改进视觉推理的系统。该代码库已经在GitHub上发布。

Read More
2023-10-24 talkingdev

OpenAgents:开放的语言模型插件框架

OpenAgents是一款用于编写语言模型插件的框架,它为用户提供了完全的控制权。该框架可以帮助用户快速构建自己的语言模型,同时具备高度的灵活性和可扩展性,用户可以根据自己的需求自由地进行定制和扩展。OpenAgents...

Read More
2023-10-24 talkingdev

评估LLMs在多轮对话中的聊天能力

本研究评估了大型语言模型(LLMs)在进行类似于人类的多轮对话时的能力。研究人员使用了一种名为Persona-Chat的数据集,该数据集包含有关对话参与者偏好和兴趣的信息。研究结果表明,LLMs在某些方面表现出了与人类类...

Read More
2023-10-24 talkingdev

自动化生成fine-tune.jsonl文件

调整语言模型需要按特定格式创建训练数据。这通常是令人沮丧和缓慢的过程。本文探讨了自动化该过程的简单方法。 深度学习模型的表现受到其训练数据的质量的影响。因此,对于特定任务,调整语言模型的能力非常重要。...

Read More
2023-10-23 talkingdev

MathGLM仍然无法解决数学问题

尽管有人声称MathGLM可以解决数学问题,但实际上它仍然无法胜任这项任务。这一现象凸显了仅仅依赖于大型语言模型的局限性。近年来,基于神经网络的自然语言处理技术取得了长足进步,但在某些特定领域,仍然需要更为...

Read More
  1. Prev Page
  2. 99
  3. 100
  4. 101
  5. Next Page