GPT-3的相关内容 - 漫话开发者

2024-01-10 talkingdev

DeepSeek LLM技术报告发布：接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5（即使它可能是3倍大小）。有关模型训练，令牌计数，模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器，它使用自...

2023-12-26 talkingdev

本文提供了一份长而广泛的调查，介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的，但可以用作学习有趣主题的跳板。在可能的情况下，它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...

2023-12-05 talkingdev

近日，美国政府与英特尔公司合作启动了一个名为ScienceGPT的训练计划。该计划旨在训练一个万亿参数的GPT模型，以便提高自然语言处理的效率和精度。GPT（Generative Pre-trained Transformer）是一种基于Transformer...

2023-11-26 talkingdev

近日，美国加州伯克利分校的研究人员开发出了一款名为MonadGPT的人工智能模型，该模型基于GPT-3，旨在探究一个问题：如果ChatGPT在17世纪得以发明，会是怎样一番景象。MonadGPT通过对17世纪的语言和文化进行研究，成...

2023-11-23 talkingdev

亚马逊正在为进入AI竞赛做准备，推出Olympus，这是一个拥有2万亿参数的大型语言模型，旨在超越OpenAI的GPT-4和谷歌的Bard。这一举措有望将亚马逊推向人工智能技术的前沿。虽然目前尚不清楚Olympus的推出时间表，但它...

2023-11-08 talkingdev

在本周的OpenAI Dev Day上，OpenAI发布了一款名为GPT-4 Turbo的API，它可以提供128k上下文的自然语言处理，以及自定义GPT和视觉功能。这款API的成本只有GPT-3的一小部分。此外，OpenAI还发布了一款名为Codex的API，...

2023-11-06 talkingdev

最近，一个名为Talk Llama的Github仓库备受关注，该仓库提供了一种在终端上与LLaMA AI进行交互的方式。LLaMA AI是一个基于GPT-3的自然语言处理模型，它的名字是“Language Model for Multi-turn Dialogue with Latent...

2023-11-01 talkingdev

据最新消息，Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码，在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器，可以用于编写各种程序代码。该模型采用...