漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-03 talkingdev

Nous Research运用Yarn方法,将Mistral 7B模型扩大到128k上下文

Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。

Read More
2023-11-03 talkingdev

亚马逊推出RoPE微调Mistral 7B模型,支持长文本上下文

亚马逊开始进入开源LLM领域,推出RoPE微调Mistral 7B模型,支持长文本上下文。该模型可在上下文中扩展至32k个令牌,可用于各种自然语言处理任务,例如问答和文本生成。RoPE是亚马逊开发的一种新的训练技术,可提高大...

Read More
2023-11-02 talkingdev

只需1美元的算力,为Mistral进行微调

Mistral是一种基于深度学习的自然语言处理模型,其7B模型是目前最大的公开模型之一。现在,您可以使用Jupyter笔记本,根据自己的数据集对Mistral的7B模型进行微调,并仅需1美元的计算费用。微调Mistral模型可以提高...

Read More
2023-11-02 talkingdev

Llama指南:如何开始使用

本指南提供信息和资源,帮助您设置Llama,包括如何访问模型、托管以及如何和集成指南。Llama是一个开源的自然语言处理模型,可以用于文本分类、情感分析和实体识别等任务。使用Llama能够提高文本处理的效率和准确性...

Read More
2023-11-02 talkingdev

神经网络具有类人的泛化语言能力

研究人员开发出一种神经网络,可以像人类一样泛化语言,胜过ChatGPT等模型。该研究结果发表在最新的AI会议上,研究人员对该神经网络进行了广泛的测试,证明它在各种语言任务中都表现出色。这一发现为自然语言处理领...

Read More
2023-11-01 talkingdev

Phind称其模型打败GPT-4,速度等同于GPT-3.5,支持16k上下文编码

据最新消息,Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码,在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器,可以用于编写各种程序代码。该模型采用...

Read More
2023-10-31 talkingdev

苹果在人工智能领域落后于竞争对手 Google 和 Microsoft

据消息人士透露,苹果在人工智能领域的进展落后于竞争对手 Google 和 Microsoft,内部人士对苹果 AI/ML 团队能否交付有所质疑。苹果的 Siri 功能在自然语言处理和语音识别等方面仍存在不少问题。苹果正加紧研发人工...

Read More
2023-10-26 talkingdev

SpellTest:基于Github的AI-to-AI测试

SpellTest是基于Github的一个新项目,旨在为基于LLM的应用提供AI-to-AI测试。LLM是一种基于语言模型的学习方法,常用于在自然语言处理和计算机视觉等领域。SpellTest可以帮助开发者在应用程序中减少拼写错误,并自动...

Read More
  1. Prev Page
  2. 37
  3. 38
  4. 39
  5. Next Page