数据集的相关内容 - 漫话开发者

2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法，该图像看起来像给定的图片，但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

2023-08-24 talkingdev

近日，一群研究者开发出一套名为TOPIC的新系统，能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动，而且还可以有效处理对象的外观变化，显著提高了多目标跟踪的准确性和效率。为...

2023-08-21 talkingdev

虽然有许多开放数据集，但能够训练前沿模型的规模却少之又少。艾伦人工智能研究所的Dolma数据集就致力于这一目标，希望能够使研究者能够在大规模上研究数据效应。这一数据集的发布，不仅为研究者提供了更高质量，更...

2023-08-18 talkingdev

在研究眼部疾病时，专家们会使用眼部内部的详细图片，但是创建这些图像既困难又耗时。本文提出了一种新的方法（DDPM）和一个数据集（ReTree），使得创建和分析这些图像比以前更加简单和快速。DDPM方法和ReTree数据集...

2023-08-17 talkingdev

在软件开发中，提交信息起着至关重要的作用，但很多提交信息都缺乏详细的描述。最近有一篇论文提出了一个新的方法，利用过去的提交历史，而非简单地生成提交信息。这篇论文提出了一个新的数据集，名为CommitChronicl...

2023-08-16 talkingdev

虽然段落任意模型（SAM）在各种数据集的分割任务中表现优异，但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性，有效地分割食品图像，甚至识别出场景中的单个食品和其他...

2023-08-16 talkingdev

IBM与Hugging Face正在向公众发布IBM的地理空间基础模型，该模型使用NASA的卫星数据进行构建。这个模型是IBM与NASA的合作成果，旨在推动AI在气候科学和地球研究中的作用，解决处理大型环境数据集的挑战。该模型已经...

2023-08-11 talkingdev

近日，多家媒体组织联名发布公开信，呼吁全球立法者考虑制定保护版权的规定，针对用于训练生成性AI模型的数据。他们要求在使用数据进行训练之前，必须对训练数据集进行透明化，并获取权利所有者的同意。公开信还要求...