模型的相关内容 - 漫话开发者

2023-11-03 talkingdev

亚马逊推出RoPE微调Mistral 7B模型，支持长文本上下文

亚马逊开始进入开源LLM领域，推出RoPE微调Mistral 7B模型，支持长文本上下文。该模型可在上下文中扩展至32k个令牌，可用于各种自然语言处理任务，例如问答和文本生成。RoPE是亚马逊开发的一种新的训练技术，可提高大...

2023-11-02 talkingdev

Hugging Face Space最近发布了两项重要技术：Segment Anything和MetaCLIP，这两项技术结合了最强大的语言模型和计算机视觉技术，能够基于文本输入进行开放式分词。开放式分词是计算机视觉领域中一个新颖且令人兴奋的...

2023-11-02 talkingdev

Mistral是一种基于深度学习的自然语言处理模型，其7B模型是目前最大的公开模型之一。现在，您可以使用Jupyter笔记本，根据自己的数据集对Mistral的7B模型进行微调，并仅需1美元的计算费用。微调Mistral模型可以提高...

2023-11-02 talkingdev

本指南提供信息和资源，帮助您设置Llama，包括如何访问模型、托管以及如何和集成指南。Llama是一个开源的自然语言处理模型，可以用于文本分类、情感分析和实体识别等任务。使用Llama能够提高文本处理的效率和准确性...

2023-11-02 talkingdev

研究人员开发出一种神经网络，可以像人类一样泛化语言，胜过ChatGPT等模型。该研究结果发表在最新的AI会议上，研究人员对该神经网络进行了广泛的测试，证明它在各种语言任务中都表现出色。这一发现为自然语言处理领...

2023-11-02 talkingdev

最近的一项研究引入了一种名为“从错误中学习”（LeMa）的方法，通过从错误中学习来教授大型语言模型解决数学问题，类似于人类学生通过纠正错误来提高自己。

2023-11-02 talkingdev

微软研究院已在其较小的语言模型Phi 1.5上增强了多模态能力，使其能够像OpenAI更大的GPT-4模型一样解释图像，但计算成本更低。Phi 1.5模型结合了文本和视觉信息，可以推断出对应的文本或图像。该模型在多个数据集上...

2023-11-01 talkingdev

近期，研究人员深入探究了多模态大型语言模型（MLLMs）中使用的视觉编码器，并发现CLIP和DINO模型中的某些特征特别适合于详细的视觉任务。他们随后引入了COMM，一种结合了两种模型优点的策略。COMM能够显著提高LLMs...