漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-29 talkingdev

论文:基于Transformer的场景图生成技术问世

研究人员开发出了一种新方法来创建场景图,使该过程更快速和高效。他们基于Transformer的技术专注于改进模型对图像中不同元素的理解和连接方式,从而提高了模型在挑战性任务上的性能。

Read More
2024-01-26 talkingdev

PPT2DST开源方法提高对话跟踪准确率

该项目提出了一种新的提示池方法,用于对话状态跟踪,无需在测试期间使用任务标识符即可适应新用户要求。

Read More
2024-01-26 talkingdev

MIT研究团队展示了一种快速打印金属的新方法

麻省理工学院的一个团队宣布了一种新的金属3D打印方法,该方法将打印速度和规模优先于分辨率。它能够以至少比可比金属添加制造过程快10倍的速度打印大型铝制品。该技术利用了一层100微米玻璃珠来创建一个结构,然后...

Read More
2024-01-24 talkingdev

自我提升AI:通过选择独特数据的DiverseEvol方法

最近,一种名为DiverseEvol的新方法在GitHub上发布,它可以让AI模型选择自己的训练数据,使其在不需要人工或其他先进AI系统的帮助下变得更好。DiverseEvol方法包括两个步骤:第一步是从数据集中选择用于训练模型的样...

Read More
2024-01-23 talkingdev

提升视觉基础模型性能:ViSFT开源

针对图像-文本训练中使用的视觉基础模型,研究人员提出了一种名为ViSFT的新方法,以提高其性能。ViSFT使用类似于语言模型中的微调的两阶段过程来增强视觉基础模型。首先,该模型使用大规模的无监督预训练来学习图像...

Read More
2024-01-22 talkingdev

论文:人物再识别新技术:相互蒸馏学习(MDPR)

研究人员开发了一种新方法,称为相互蒸馏学习(MDPR),通过结合两种不同的技术,增强了人物再识别。该方法利用两个网络相互学习,一个网络学习到了身份特征,另一个网络学习到了外观特征,从而提高了人物再识别的准确...

Read More
2024-01-22 talkingdev

UV-SAM-探测城市村庄边界的新方法开源

近日,一项名为UV-SAM的新技术通过GitHub仓库公开,该技术是对视觉基础模型和Segment Anything模型的改进,利用卫星图像可以准确识别出城市村庄的边界。与传统的现场调查相比,UV-SAM提供了一种高效的替代方案,结合...

Read More
2024-01-15 talkingdev

论文:自我监督学习提高歌声合成相似度和泛化性能

研究人员开发了一种新的框架来更好地理解和分析歌声。通过在孤立的人声轨道上进行自我监督学习,并专注于域外泛化,他们在歌声相似性和合成等任务上取得了进展,从而改进了现有技术。这种新方法可以通过对歌声的不同...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page