去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...
Read More两位非虚构作家向微软和OpenAI提起了一项集体诉讼,指控其在创建像ChatGPT这样的AI系统时侵犯了版权。此案件与《纽约时报》的类似案件相似,并声称被告在未经授权的情况下使用了版权作品。作者正在寻求代表受影响作...
Read MoreV*是一种新的基于图像的搜索算法,可以显著提高GPT-V(和其他VLM)验证码识别性能。这项技术的开发者表示,V*可以通过大量的图像数据来训练模型,从而提高模型的精度。V*算法的另一个优点是它可以将不同的图像元素组...
Read MoreOpenAI发布了一份全面的、分步骤的指南,分享了如何从大型语言模型(如GPT-4)中获得更好的结果的策略和技巧。该指南提供了从选择Prompt到微调和优化的详细步骤,并介绍了一些最佳实践和调试技巧。此外,该指南还包...
Read MoreOpenAI计划在未来一周内推出GPT Store。为了符合上线标准,开发者需要确保他们的GPT模型合规,验证其用户资料,并将其作品设为“公开”。GPT Store的推出将使得各种GPT模型更容易被普通用户使用,也将推动人工智能技术...
Read More这篇文章回顾了2023年主流的人工智能产品和趋势,按月份列出了产品发布情况,并提供了用户数量和其他相关指标。亮点包括ChatGPT在1月份达到1亿月活用户,Balenciaga Pope在3月份爆红,获得了2800万观看次数,AI封面...
Read More微软的研究人员使用合成数据来训练基于Mistral的解码器,以改进嵌入技术。该技术是同类产品中最佳的。有趣的是,他们使用GPT-4的两步提示策略来生成合成检索训练数据。
Read More本文提供了一份长而广泛的调查,介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的,但可以用作学习有趣主题的跳板。在可能的情况下,它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...
Read MoreOpenAI超级对齐团队最新成果表明,您可以使用更弱的监督模型来引导或对齐更强大的模型,类似于弱人类对齐超级智能模型。他们使用GPT-2恢复了GPT-4的大部分对齐性能。他们指出,这种方法具有可行的路径,可以实现显著...
Read More