图像分类的相关内容 - 漫话开发者

2024-03-06 talkingdev

SURE-提高神经网络图像分类置信度

SURE技术是一种将多种技术结合起来，提高深度神经网络对于图像分类任务中不确定性预测可靠性的新方法。该方法通过模型置信度估计、模型不确定性估计和置信度校准三个步骤来实现置信度的提高。SURE技术的应用将大大提...

2024-02-09 talkingdev

这篇论文重新审视了经典的高斯判别分析（GDA）算法，以改善CLIP在图像分类任务中的性能，而不需要额外的训练或资源。GDA算法通过增加一个基于贝叶斯公式的先验，实现了对输入向量的加权处理，从而有效地降低了噪声对...

2023-12-05 talkingdev

SAFE是一种新的模式识别融合框架，它结合了预训练的视觉和语言模型，使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景，具有广泛的应用前景。在实现过程中...

2023-11-03 talkingdev

这项研究表明，使用大型语言模型将类别组织成层次结构可以提高图像分类的准确性，从而解决预训练模型（如CLIP）中存在的偏差问题，这些模型会混淆相似的类别。

2023-08-29 talkingdev

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG：动物，用于评估图像分类器鲁棒性的PUG：ImageNet，以及用于视觉语言模型评估的PUG：SPAR。这些数据集的发...

2023-08-07 talkingdev

一项最新研究介绍了PerceptionCLIP，这是一种模拟人类视觉感知过程的两步图像分类方法，旨在更好地利用CLIP，一种突出的视觉语言模型。首先，通过识别背景属性并利用它们区分前景物体，这种新方法在图像分类任务中提...

2023-06-15 talkingdev

**研究团队最新发布的技术论文介绍了SoViT，这是一种针对大小和形状进行了优化的视觉转换器，使用先进的缩放方法，其性能与更大的模型相当，但计算量更少。SoViT在图像分类、字幕生成、视觉问答和零样本转移等各个任...

2023-04-17 talkingdev

以下是本文的主要内容： - 文本到图像扩散模型在定制连续性概念时面临灾难性遗忘问题，导致过去概念的图像生成质量低下。 - 我们提出的C-LoRA方法通过持续自我正则化的低秩适应性克服了这个问题，在连续扩散方面优...