漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-20 talkingdev

CulturaX发布6T多语言数据标记,助推多语言模型发展

在谷歌的新数据集发布后,CulturaX紧随其后,推出了新的数据集。这是一个清洁整理过的多语言数据标记集,总量达到了6T。这一数据集的发布,将为多语言语言模型的进一步发展提供巨大的助力。谷歌和CulturaX的这两次数...

Read More
2023-09-15 talkingdev

开源新数据集助力识别伪造名人照片

DeepFakeFace (DFF) 是一个由先进技术生成的伪造名人照片的集合,旨在帮助我们更好地区分真实照片和伪造的照片。这个数据集集合了大量的伪造名人照片,这些照片的制作都运用了尖端的科技,如深度学习和人工智能等,...

Read More
2023-09-13 talkingdev

论文:人工智能获得嗅觉,准确识别气味

科研人员成功训练出一个模型,通过使用自定义的数千种手动标记分子的数据集训练图神经网络,使其能够准确地识别气味。这是人工智能在模拟人类感知能力方面的一次重大突破,标志着人工智能在感知世界的能力上迈出了新...

Read More
2023-09-13 talkingdev

行星级规模的检索增强生成技术

Arcus公司通过使用分层检索器将检索增强生成(RAG)技术扩展到行星级规模。这种技术是通过将文件基于其语义内容进行分组聚类,然后逐步过滤这些组来缩小搜索空间。这样可以检索到更相关的上下文,减少幻觉,并在行星...

Read More
2023-09-06 talkingdev

Topical-Chat,AI机器人如何更自然地进行现实生活对话

许多AI聊天机器人在进行像人类那样的自然、广泛的对话时都面临困难,因此GitHub发布了一个名为‘Topical-Chat’的新项目。这个项目引入了一个新的数据集,该数据集来自人类在8个大话题上的对话,旨在教会AI如何以更接...

Read More
2023-09-01 talkingdev

评估计算机视觉模型的公平性:Meta发布DINO v2模型

在持续推动成为AI领域的开源贡献者的过程中,Meta公司近日公布了他们的DINO v2模型,并采用了更为宽松的许可证,允许社区在其基础上进行构建。此外,他们还发布了一个数据集,有助于确定并对各种计算机视觉模型中的...

Read More
2023-09-01 talkingdev

Duic开源-智能解码技术提升图像质量

本项目研发了一种调整图像解码方式的方法,特别适用于处理不熟悉的数据集。该过程更新解码器中的某些设置,确保在不消耗大量数据的情况下,依然能够获得高质量的图像。此外,该系统还能根据图像的类型实时适应,以获...

Read More
2023-08-31 talkingdev

BatteryML:微软开源电池退化研究模型工具包

近日,一款名为「BatteryML」的开源工具包在技术圈内引起了广泛的关注。该工具包主要用于电池退化方面的研究,包括数据集、特征工程工具,以及一个模型库。它提供了一种全新的方式来研究和理解电池退化的过程,为电...

Read More
2023-08-29 talkingdev

Meta AI发布基于虚幻引擎的超真实图形数据集

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG:动物,用于评估图像分类器鲁棒性的PUG:ImageNet,以及用于视觉语言模型评估的PUG:SPAR。这些数据集的发...

Read More
2023-08-28 talkingdev

WizardLM团队利用新技术突破开源代码模型性能瓶颈,超越Phind模型

近日,WizardLM团队利用他们的Evol instruct技术显著提升了Llama代码的性能,甚至击败了Phind模型。此次成果尽管受到一些质疑,因为他们生成的指令直接提升了评估分数,而未使用固定的数据集,也没有把评估视为固定...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page