漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-17 talkingdev

Ex-MCR:无配对数据的多模态学习方法

这项研究介绍了一种名为Ex-MCR的新方法,该方法可以有效地学习多个模态的统一对比表示,而无需配对数据。通过对齐现有的多模态对比表示,Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...

Read More
2023-10-06 talkingdev

Meta揭秘大脑波形中的语言密码

Meta科学家最近开发出了一种全新的方法,通过研究大脑波形,理解人们思考或听到的词语和短语,而无需进行任何手术。这一技术或许将为我们提供新的视角,去理解大脑如何处理和解码语言信息。通过这种方法,我们将有可...

Read More
2023-09-26 talkingdev

论文:利用文本描述理解并标记3D场景的PVLFF新模型

科研人员近日开发出一种名为PVLFF的新模型,这种模型能够观察3D场景,并不仅能识别其中的内容,还可以利用文本描述区分同一物体的不同实例。在现实世界中,同一物体可能有许多不同的实例,而这种模型能够通过文本描...

Read More
2023-09-25 talkingdev

打造超真实虚拟人形:新模型生成各种姿态与身形

本篇论文提出了一种能够创造出超级真实的虚拟人类模型,无论你想到的任何姿势,这种模型都能完美呈现。这是首款仅通过虚拟数据训练出来的模型,但其所生成的人类形态却具有极高的准确度,这对科学研究和电子游戏领域...

Read More
2023-09-22 talkingdev

论文:模型如何理解声音和视觉的结合?

这项研究介绍了AV-SUPERB,这是一个新的基准测试,用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展,并为未来的研究提供一个统一的平台。这项研究突出了模...

Read More
2023-09-21 talkingdev

理解手部动作的更佳途径:RenderIH与TransHand的全新应用

最近的研究引入了RenderIH,这是一个包含各种手部位置的超现实图像的庞大收藏,解决了旧数据集过于简单的问题。同时,研究还呈现了TransHand,这是一个能够非常精确读取这些手部位置的新工具。RenderIH的引入,不仅...

Read More
2023-09-19 talkingdev

打破维度界限:2D与3D图像创作的无缝融合

科研人员已经找到了一种方法,使得2D和3D技术能够无缝地协同工作,以实现更优秀且更具灵活性的设计。这种新的技术能够打破传统的维度界限,为图像设计领域带来革新性的突破。不仅如此,该方法还能大大提高图像设计的...

Read More
2023-09-15 talkingdev

论文:打造更优质的推荐系统,模型HAMUR的研发和改进

科研人员已经开发出一种新的模型,名为HAMUR,以改进模型在多个主题或领域(如音乐、书籍或电影)中的推荐方式。与旧的方法混淆这些领域之间的信息不同,HAMUR采用了一种特殊的技术,使数据保持独立且更具灵活性。这...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page