漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-07 talkingdev

论文:利用LLM技术提升婴儿级语言模型的性能

最近,一篇论文的作者们开发出了一种名为“共思”的方法,该方法利用大型语言模型来提高较小的“婴儿级”模型的训练效果。他们通过重新处理GPT-3.5-turbo的数据集,并以RoBERTa的方式训练较小的模型,使得该模型在语言测...

Read More
2023-08-03 talkingdev

论文:评测YOLO基础物体检测模型:YOLOBench研究报告

最近的一项研究介绍了'YOLOBench',这是一个针对超过550种基于YOLO(You Only Look Once,你只看一次)方法的物体检测模型的性能测评。这些模型在四个独特的数据集和硬件系统上进行了测试。YOLO是一种流行且高效的物...

Read More
2023-08-02 talkingdev

论文:自动音乐字幕系统取得显著成绩

为音乐产生人类可读的描述对于大多数系统来说都是一项挑战,甚至对于人类来说也相当困难!然而,凭借一些巧妙的数据采集和标签技术,研究人员成功地收集了一个涵盖各种音乐流派的2.2m字幕数据集。他们在此数据集上训...

Read More
2023-08-01 talkingdev

论文:利用大型语言模型提升交通安全性

尽管大型语言模型(LLMs)在众多自然语言处理任务中取得了成功,但在交通安全领域却显得力不从心,因为这需要专门的知识。为解决这个问题,研究人员开发了TrafficSafetyGPT,这是一个经过独特数据集微调的LLM模型。...

Read More
2023-08-01 talkingdev

开源新方法推动大规模数据生成

这项研究提出了一个新的范式,用于创建大规模、多样化的数据集,以训练AI代理进行视觉导航。在这种新的方法中,我们采用了一种创新的数据生成策略,这种策略能够有效地处理大规模的数据,同时保证数据的多样性和质量...

Read More
2023-07-28 talkingdev

JourneyDB - 生成图像基准:发布400万高质量、策划的文本和图像对

近日,已发布超过400万对高质量、经过策划的文本和图像对,用于视觉问题回答。所有这些数据都是由Midjourney合成生成的,因此有人戏称这个数据集为Midjourney蒸馏数据集。这意味着该数据集能够提供丰富的视觉和语言...

Read More
2023-07-28 talkingdev

HQTrack-高质量视频对象追踪和分割开源框架

这个仓库介绍了HQTrack,这是一个高质量的视频对象追踪框架,利用先进的感知算法来追踪单个和多个对象,同时精细化他们的边界。尽管只在有限的数据集上进行训练,HQTrack通过在不使用任何额外的数据增强或模型集成的...

Read More
2023-07-24 talkingdev

SlowTV数据集开源,助力单目深度估计能力

近日,研究人员推出了一个名为SlowTV的大规模数据集,该数据集主要从YouTube收集而来,旨在提升自监督单目深度估计模型在不同环境下的深度理解能力。这些环境场景包括徒步旅行的小路、水下场景以及室内空间等。通过...

Read More
  1. Prev Page
  2. 32
  3. 33
  4. 34
  5. Next Page