清华大学与斯坦福大学联合研究团队近日发布突破性研究成果ReasoningBank,该框架通过构建推理记忆系统解决长期困扰大语言模型智能体的历史经验复用难题。传统智能体在持续执行现实任务时,往往将每次交互视为独立事...
Read More近日,信息检索领域迎来突破性进展——基于生成式模型的上下文排序(ICR)技术实现规模化应用。传统ICR方法通过将任务描述、候选文档和查询直接输入大语言模型(LLM)来识别相关文档,虽效果显著但存在计算效率瓶颈:...
Read More最新研究将因果图学习技术成功拓展至回归任务领域,通过创新性地采用对比学习框架优化干预策略,显著提升了图级别回归任务中对混杂变量的处理能力。该技术突破来自arXiv预印本平台的最新论文,其核心价值在于解决了...
Read MoreNVIDIA近期在Hugging Face Hub上发布了一系列文本与图像嵌入模型(Radio系列),其性能在多项基准测试中达到或超越当前热门的SigLIP模型。这些模型通过先进的神经网络架构优化了多模态数据的向量表示能力,可广泛应...
Read More谷歌研究院与加州大学团队在arXiv最新发表的论文提出3D CoCa框架,这一突破性技术通过整合视觉语言对比学习(Contrastive Learning)与场景描述(Captioning)两大前沿方向,实现了对三维场景的多模态联合理解。该框...
Read More德国视觉与学习实验室(Visinf)最新提出的CUPS(Contrastive Unsupervised Panoptic Segmentation)技术,开创性地实现了无需人工标注数据的全景分割模型训练。该方法通过挖掘场景中心图像中的深度信息和运动线索,...
Read MoreDeepMind近日发布了名为TIPS的新型图像-文本模型,专为密集型和全局视觉任务设计。该模型通过结合对比学习与掩码图像建模技术,并利用合成字幕进行训练,显著提升了空间感知能力。在多项基准测试中,TIPS的表现均超...
Read More近年来,随着多模态学习的发展,构建能够同时处理视觉和语言任务的嵌入模型成为研究热点。然而,传统基于对比损失的方法在处理硬负样本时往往表现不佳,导致模型在复杂检索任务中效果受限。近期,一项研究提出了一种...
Read More