大型语言模型的相关内容 - 漫话开发者

2023-08-31 talkingdev

微软发布新型AI训练法“思想算法”

微软发布了一种名为“思想算法”（AoT）的新型AI训练方法，旨在使大型语言模型如ChatGPT的推理能力更加高效和类人化。这种新颖的AI训练方法是微软在人工智能领域的一项重要突破，表明了微软在深化机器学习和人工智能技...

2023-08-25 talkingdev

本文探讨了为何现有的大型语言模型（LLMs）不太可能导致人工通用智能（AGI）的发展，以及为何物理学本身将阻止我们从现在的状态突然跃升到AGI。当前的LLMs，虽然在某些方面已经取得了显著的进步，但是在理解和推理的...

2023-08-25 talkingdev

Meta发布了Code Llama，这是一个建立在Llama 2之上的大型语言模型，专门用于生成和调试代码。它还发布了一个针对Python的特定版本，以及另一个可以理解自然语言指令的版本。这些模型不能互换使用。Meta声称Code Llam...

2023-08-21 talkingdev

对于大多数大型语言模型（LLM）应用，微调并非必要。使用少量提示或检索增强生成（RAG）可能是更好的选择。少量提示是指向LLM提供期望输出的示例，而RAG则涉及查询向量数据库，获取LLM未经训练的信息。这意味着，我...

2023-08-18 talkingdev

近期，WizardLM团队的研究进展备受关注。他们最新的论文探讨了用于指令调整的数据策划问题。WizardLM在强化学习部分做出了突破性的提升，成功超越了许多封闭源模型在数学和推理任务上的表现。他们的研究成果可能会对...

2023-08-17 talkingdev

强化学习可能是当前对齐大型语言模型（甚至视觉模型）最好的工具。然而，当你需要大量的人类数据来训练一个奖励模型时，这就成为了一项挑战。如果你可以只使用“提示”呢？这是RLCF（强化学习计算框架）趋势的又一绝佳...

2023-08-16 talkingdev

OpenAI，ChatGPT的创造者，一直在使用其最先进的大型语言模型来执行公司的内容政策。对于诸如令人不安的内容、欺诈以及滥用等问题，OpenAI正在使用ChatGPT来进行自动化处理。然而，该技术仍有其局限性。在某些情况下...

2023-08-15 talkingdev

本文介绍了在编码或专业工作之外，大型语言模型的日常应用。这些应用包括将模型用于整理购物清单、总结书籍笔记、查询字典、将任务转化为子任务以及作为编辑器。文章还介绍了一些大型语言模型不太适用的方面，如生成...