中国领先的新能源汽车制造商比亚迪公司近日推出了一款全新混合动力系统,该系统能够在不进行充电或加油的情况下行驶超过2000公里。这项技术使得搭载了这一动力系统的汽车能够从纽约一直行驶到迈阿密,无需中途充电或...
Read More在大型视觉语言模型(LVLMs)中,输出结果往往更倾向于语言模型的先验知识,而非实际的视觉输入。这一项目通过引入“校准”和“去偏采样”技术,有效减少了这种偏差。这些技术使得模型在处理各种任务时,能够生成更加准...
Read MoreLeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...
Read More深度学习领域有了一项新的突破。研究人员开发出了一个新的状态空间模型,这一模型使用双重转移函数表示。其主要特点是一个无状态的序列并行推理算法。这种新的推理算法能够在处理大规模数据时,有效提高计算效率和准...
Read More一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...
Read More据报道,LMSYS正在进行GPT-4.5或GPT-5的测试。这是一项令人兴奋的技术进步,将进一步提高自然语言处理的质量和准确性,同时也将为人工智能领域带来更多的发展机会。 尽管这些新技术的细节尚未公开,但LMSYS的测试表...
Read MoreAny2Point是GitHub上公开的一种新型方法,它能够高效地将视觉、语言和音频模型的能力转换到3D领域,同时保留空间几何信息。这一技术突破意味着开发者和研究人员能够利用现成的2D模型,通过Any2Point转换技术,快速拓...
Read More最新的研究提出了一种从弱到强的引导框架,用于改进多摄像头3D物体检测(MC3D-Det)中的周边精细化处理。该领域借助鸟瞰技术得到了显著增强。该框架通过优化算法,提高了物体检测的精确度和实时性,对于自动驾驶、机...
Read MoreMistral公司近日发布了一款新型的8x22B模型,并通过磁力链接供用户下载体验。根据社区首批基准测试结果显示,该模型作为基础模型表现突出,其77 MMLU(与推理能力密切相关的指标)得分令人瞩目。这一新模型的出现,...
Read MoreDreamView近期推出了一项革命性的技术,能够根据文本描述生成3D对象,并支持从多个视角进行详细定制,同时确保物体整体的一致性。这一技术突破为3D设计师和开发者提供了前所未有的便利,使得从概念到实现的过程更加...
Read More