漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-13 talkingdev

[论文推荐]CATANet:通过长距离内容相似性标记聚合实现图像超分辨率

近期,一项名为CATANet的创新技术在高分辨率图像生成领域取得了重要进展。该技术通过聚合长距离内容相似的标记(tokens),显著提升了图像超分辨率的效果。传统的超分辨率方法通常依赖于局部特征的处理,而CATANet则...

Read More
2025-03-12 talkingdev

[论文推荐] 广义离散扩散: 提升文本数据去噪效率与自校正能力

在最新的研究进展中,科学家提出了一种广义离散扩散方法,该方法显著改进了在文本等离散数据上的扩散过程。这一创新通过引入一种广义的去噪过程和略微改进的掩码方案,使得训练过程更加高效,并赋予了模型自我校正输...

Read More
2025-03-12 talkingdev

[论文推荐] 基于硬负样本加权的对比学习构建大规模语言和视觉嵌入模型

近年来,随着多模态学习的发展,构建能够同时处理视觉和语言任务的嵌入模型成为研究热点。然而,传统基于对比损失的方法在处理硬负样本时往往表现不佳,导致模型在复杂检索任务中效果受限。近期,一项研究提出了一种...

Read More
2024-12-26 talkingdev

papermatch:可对ArXiv论文进行语义搜索

近日,一个网站引起了科技界的关注,该网站提供了一种全新的功能,即可对ArXiv上的论文进行语义搜索。这一功能利用自然语言处理(NLP)技术,允许用户通过输入论文的关键词或者摘要描述来搜索相关论文,极大地提高了...

Read More
2024-09-09 talkingdev

alphaXiv:在arXiv基础上开启开放研究讨论

alphaXiv是一个新兴的平台,旨在为研究人员提供一个开放的讨论空间,尤其是在科学和技术领域。该平台建立在arXiv的基础之上,允许研究人员在上传论文时与同行进行互动,分享观点和反馈。这种开放的讨论形式不仅可以...

Read More
2023-10-17 talkingdev

论文:SupFusion提高LiDAR和相机检测能力

一篇发表在arXiv上的论文介绍了一种新技术SupFusion,它能够使激光雷达(LiDAR)和相机系统更好地协同工作,用于检测汽车或行人等物体。这项技术使用多任务学习方法,同时考虑激光雷达和相机的输出,将它们融合成更...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17