漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-10 talkingdev

DeepSeek LLM技术报告发布:接近GPT-3.5水平

去年最好的编码模型之一是DeepSeek LLM。它在许多基准测试中接近GPT-3.5(即使它可能是3倍大小)。有关模型训练,令牌计数,模型架构等的信息已在技术报告中发布。DeepSeek LLM是一种基于语言模型的编码器,它使用自...

Read More
2024-01-09 talkingdev

微软、OpenAI因版权侵权被非虚构书籍作者起诉

两位非虚构作家向微软和OpenAI提起了一项集体诉讼,指控其在创建像ChatGPT这样的AI系统时侵犯了版权。此案件与《纽约时报》的类似案件相似,并声称被告在未经授权的情况下使用了版权作品。作者正在寻求代表受影响作...

Read More
2024-01-09 talkingdev

V*搜索:提高GPT-V验证码识别性能的视觉算法

V*是一种新的基于图像的搜索算法,可以显著提高GPT-V(和其他VLM)验证码识别性能。这项技术的开发者表示,V*可以通过大量的图像数据来训练模型,从而提高模型的精度。V*算法的另一个优点是它可以将不同的图像元素组...

Read More
2024-01-08 talkingdev

OpenAI发布官方Prompt工程指南

OpenAI发布了一份全面的、分步骤的指南,分享了如何从大型语言模型(如GPT-4)中获得更好的结果的策略和技巧。该指南提供了从选择Prompt到微调和优化的详细步骤,并介绍了一些最佳实践和调试技巧。此外,该指南还包...

Read More
2024-01-08 talkingdev

OpenAI GPT Store 下周上线,开发者需保持合规性

OpenAI计划在未来一周内推出GPT Store。为了符合上线标准,开发者需要确保他们的GPT模型合规,验证其用户资料,并将其作品设为“公开”。GPT Store的推出将使得各种GPT模型更容易被普通用户使用,也将推动人工智能技术...

Read More
2024-01-04 talkingdev

2023年消费级人工智能回顾

这篇文章回顾了2023年主流的人工智能产品和趋势,按月份列出了产品发布情况,并提供了用户数量和其他相关指标。亮点包括ChatGPT在1月份达到1亿月活用户,Balenciaga Pope在3月份爆红,获得了2800万观看次数,AI封面...

Read More
2024-01-03 talkingdev

论文:微软研究使用LLM改进文本嵌入技术

微软的研究人员使用合成数据来训练基于Mistral的解码器,以改进嵌入技术。该技术是同类产品中最佳的。有趣的是,他们使用GPT-4的两步提示策略来生成合成检索训练数据。

Read More
2023-12-26 talkingdev

如何让大型语言模型运行更快

本文提供了一份长而广泛的调查,介绍了让大型语言模型运行更快的不同方法。列表不是完全穷尽的,但可以用作学习有趣主题的跳板。在可能的情况下,它包括相关论文和博客文章的链接。本文介绍了不同的方法来优化大型语...

Read More
2023-12-19 talkingdev

微调Mistral 7B在卡牌游戏中的应用

通过在魔法飞天卡牌游戏中进行微调实验,以提高GPT-4的性能,获得了一个精细调整的7B参数模型,其性能接近于人类水平。

Read More
2023-12-18 talkingdev

OpenAI超级对齐团队新成果:从弱到强泛化

OpenAI超级对齐团队最新成果表明,您可以使用更弱的监督模型来引导或对齐更强大的模型,类似于弱人类对齐超级智能模型。他们使用GPT-2恢复了GPT-4的大部分对齐性能。他们指出,这种方法具有可行的路径,可以实现显著...

Read More
  1. Prev Page
  2. 23
  3. 24
  4. 25
  5. Next Page