漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-10 talkingdev

Roboflow发布GPTV示例,辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。

Read More
2023-11-09 talkingdev

使用Manifold Markets的5000个问题测试GPT-4的准确性,结果显示它的预测存在过度自信现象

近日,一项使用Manifold Markets的5000个问题测试GPT-4准确性的研究结果显示,GPT-4在预测时存在过度自信的现象。研究人员发现,GPT-4所给出的答案在很多情况下都是正确的,但其自信度却远远超过了正确率。这种过度...

Read More
2023-11-08 talkingdev

30T多语言开放数据集发布

Red Pajama v2已发布。它比用于训练GPT-4的数据集大2.5倍。它包含5种语言的多语言数据,并具有令人印象深刻的广度。重要的是,已经完成了许多去重工作和一些启发式过滤工作,没有代码数据。

Read More
2023-11-08 talkingdev

OpenAI Dev Day回顾

在本周的OpenAI Dev Day上,OpenAI发布了一款名为GPT-4 Turbo的API,它可以提供128k上下文的自然语言处理,以及自定义GPT和视觉功能。这款API的成本只有GPT-3的一小部分。此外,OpenAI还发布了一款名为Codex的API,...

Read More
2023-11-02 talkingdev

微软通过重大突破推动小型AI模型的界限

微软研究院已在其较小的语言模型Phi 1.5上增强了多模态能力,使其能够像OpenAI更大的GPT-4模型一样解释图像,但计算成本更低。Phi 1.5模型结合了文本和视觉信息,可以推断出对应的文本或图像。该模型在多个数据集上...

Read More
2023-11-01 talkingdev

论文:深度解析医学视觉问答,GPT-4与视觉的结合

该研究主要评估了GPT-4与视觉(GPT-4V)针对来自多种来源的医学图像(如X光和CT扫描)提出的问题的回答能力。这是一项极具挑战性的任务,它需要深度的医学知识和高级的视觉理解能力。GPT-4V作为一种尖端的人工智能技...

Read More
2023-11-01 talkingdev

Phind称其模型打败GPT-4,速度等同于GPT-3.5,支持16k上下文编码

据最新消息,Phind模型在编码方面的表现已经超过了目前最强的GPT-4。该模型支持16k上下文编码,在编码速度上也不逊于GPT-3.5。Phind模型是一种基于自然语言处理技术的编码器,可以用于编写各种程序代码。该模型采用...

Read More
2023-10-27 talkingdev

论文:评估GPT-4V的光学字符识别能力

本文研究了大型多模型GPT-4V在各种光学字符识别(OCR)任务中的表现,包括读取场景和手写文本,理解复杂的文档结构等。

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page