近日,一项研究引入了一种名为Solo Performance Prompting(SPP)的方法。该方法利用LLMs中的多个角色模拟认知协同,这是一种提高问题解决能力的协作过程。通过使用经过精细调整的角色,SPP使LLMs能够处理需要深度领...
Read More本文探讨了一个微型模型的训练动态,并反向工程了它找到的解决方案。这为我们揭示了一个令人兴奋的新兴领域——机械可解释性。机器学习模型在工作时,是通过记忆数据还是通过泛化理解进行推理?这是一个长期存在且至关...
Read More近日,WizardLM团队公布了全球最佳的开源数学模型。这个模型在处理多步骤问题的推理能力上表现出色,同时,模型还具有一定的“幻想”能力,这在数学领域表现得十分有趣,并且可以提供解释。如果你对学习数学感兴趣,那...
Read More深度神经网络在计算机视觉领域有着出色的表现,但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略,能够更好地从老师网络向学生网络传...
Read More英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...
Read More虽然生成式人工智能(AI)的表现令人赞叹,但由于在推理类型上的根本概念限制,其智能水平尚未达到人类的水平。这不仅对当前的AI技术具有重要意义,同时也对于创造真正的人工通用智能(AGI)起到了决定性的作用。生...
Read More图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...
Read More最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...
Read MoreSoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...
Read More这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...
Read More