漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-19 talkingdev

微调Mistral 7B在卡牌游戏中的应用

通过在魔法飞天卡牌游戏中进行微调实验,以提高GPT-4的性能,获得了一个精细调整的7B参数模型,其性能接近于人类水平。

Read More
2023-12-18 talkingdev

OpenAI超级对齐团队新成果:从弱到强泛化

OpenAI超级对齐团队最新成果表明,您可以使用更弱的监督模型来引导或对齐更强大的模型,类似于弱人类对齐超级智能模型。他们使用GPT-2恢复了GPT-4的大部分对齐性能。他们指出,这种方法具有可行的路径,可以实现显著...

Read More
2023-12-15 talkingdev

OpenAI与Axel Springer签署许可协议,用新闻内容训练AI模型

OpenAI与柏林出版商Axel Springer达成协议,将使用该出版商的内容来训练其生成式AI模型,并将最近由Axel Springer发布的文章添加到ChatGPT中。这项协议将使OpenAI的AI模型能够更好地理解新闻内容和语言,从而提高其...

Read More
2023-12-15 talkingdev

Gemini多模态能力初探

Gemini在各种视觉任务中比许多开放模型表现更好。它在相同任务中似乎与GPT-V竞争力十足。

Read More
2023-12-15 talkingdev

Cerebras发布gigaGPT模型训练框架

Cerebras是一家人工智能训练芯片制造商,近日发布了一个在其系统上训练大型模型的框架,名为gigaGPT。该框架非常简单易用,不需要将大型模型分割成多个GPU和节点进行训练。

Read More
2023-12-12 talkingdev

LLM原理的可视化呈现

LLM可视化是一个网站,用于展示nano-gpt模型如何将6个字母的序列按字母顺序排序。nano-gpt模型是由85,000个参数组成的模型,其基础是GPT-2,该模型可用于生成自然语言文本。该网站使用了交互式的可视化工具,用户可...

Read More
2023-12-11 talkingdev

ChatGPT内置SEO GPT工具,即时提升网站SEO

ChatGPT发布了内置SEO GPT工具,为用户提供即时SEO技术支持。该工具使用GPT技术,可从搜索引擎角度分析网站内容,提供有效的SEO策略以提升网站排名。用户只需在ChatGPT中输入网站链接,即可获得详细的SEO分析报告和...

Read More
2023-12-11 talkingdev

Elon Musk旗下AI初创公司xAI推出Grok

Elon Musk旗下的xAI AI初创公司推出了一款名为Grok的新聊天机器人,该机器人是ChatGPT的竞争者,目前仅限于美国的Premium Plus订阅者在X平台上使用。

Read More
2023-12-08 talkingdev

BenchLLM开源,测试大型多模态模型的基准

这个项目介绍了BenchLMM,一个专门设计用于测试GPT-4V和LLaVA等大型多模态模型对各种图像样式的鲁棒性的基准。

Read More
2023-12-08 talkingdev

Google Gemini:原生多模态模型,文本能力达到GPT4水平

Google的旗舰机型Gemini是一款原生多模态模型,其文本能力达到了GPT4的水平,同时还能够处理许多其他数据序列。此外,它还训练了Alpha Code 2,这是一个在代码力量比赛中排名前15%的编码器。Alpha Code 2将在12月13...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page