漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-26 talkingdev

通过被动摄像头增强深度估计的研究

这项研究提出了一种在被动摄像头中模拟主动立体感的方法,而无需使用物理图案投影仪。研究人员通过利用外部传感器的深度数据虚拟叠加图案,克服了传统设置的局限性。这种方法在各种数据集上都增强了立体算法和深度学...

Read More
2023-09-21 talkingdev

理解手部动作的更佳途径:RenderIH与TransHand的全新应用

最近的研究引入了RenderIH,这是一个包含各种手部位置的超现实图像的庞大收藏,解决了旧数据集过于简单的问题。同时,研究还呈现了TransHand,这是一个能够非常精确读取这些手部位置的新工具。RenderIH的引入,不仅...

Read More
2023-09-20 talkingdev

CulturaX发布6T多语言数据标记,助推多语言模型发展

在谷歌的新数据集发布后,CulturaX紧随其后,推出了新的数据集。这是一个清洁整理过的多语言数据标记集,总量达到了6T。这一数据集的发布,将为多语言语言模型的进一步发展提供巨大的助力。谷歌和CulturaX的这两次数...

Read More
2023-09-15 talkingdev

开源新数据集助力识别伪造名人照片

DeepFakeFace (DFF) 是一个由先进技术生成的伪造名人照片的集合,旨在帮助我们更好地区分真实照片和伪造的照片。这个数据集集合了大量的伪造名人照片,这些照片的制作都运用了尖端的科技,如深度学习和人工智能等,...

Read More
2023-09-13 talkingdev

论文:人工智能获得嗅觉,准确识别气味

科研人员成功训练出一个模型,通过使用自定义的数千种手动标记分子的数据集训练图神经网络,使其能够准确地识别气味。这是人工智能在模拟人类感知能力方面的一次重大突破,标志着人工智能在感知世界的能力上迈出了新...

Read More
2023-09-13 talkingdev

行星级规模的检索增强生成技术

Arcus公司通过使用分层检索器将检索增强生成(RAG)技术扩展到行星级规模。这种技术是通过将文件基于其语义内容进行分组聚类,然后逐步过滤这些组来缩小搜索空间。这样可以检索到更相关的上下文,减少幻觉,并在行星...

Read More
2023-09-06 talkingdev

Topical-Chat,AI机器人如何更自然地进行现实生活对话

许多AI聊天机器人在进行像人类那样的自然、广泛的对话时都面临困难,因此GitHub发布了一个名为‘Topical-Chat’的新项目。这个项目引入了一个新的数据集,该数据集来自人类在8个大话题上的对话,旨在教会AI如何以更接...

Read More
2023-09-01 talkingdev

评估计算机视觉模型的公平性:Meta发布DINO v2模型

在持续推动成为AI领域的开源贡献者的过程中,Meta公司近日公布了他们的DINO v2模型,并采用了更为宽松的许可证,允许社区在其基础上进行构建。此外,他们还发布了一个数据集,有助于确定并对各种计算机视觉模型中的...

Read More
  1. Prev Page
  2. 34
  3. 35
  4. 36
  5. Next Page