LoRA-Ensemble是一种面向自注意力网络的参数高效深度集成方法。该技术扩展了低秩适配(LoRA)的应用,通过隐式集成实现了在不增加传统集成方法高计算成本的情况下,仍能做出准确且校准良好的预测。这种方法不仅在精...
Read MoreLeMeViT是一种新的方法,通过使用可学习元令牌来降低视觉Transformer的计算成本。这些元令牌能够高效地捕捉关键信息,从而显著提高推理速度。与传统的视觉Transformer相比,LeMeViT在保持高精度的同时,大幅减少了计...
Read More人工智能公司Hugging Face宣布,将免费提供价值1000万美元的共享图形处理器(GPUs)资源,以帮助开发者、学者和初创公司创建新的AI技术。此举旨在抵消科技巨头主导的AI发展的集中趋势。Hugging Face希望通过这项举措...
Read More近日,gpudeploy.com推出了全新的GPU部署服务,该服务为用户提供了一种简单,快速的方式来部署和使用GPU。用户只需上传其模型和数据,gpudeploy.com即可为其提供简单易用的GPU计算资源,就像Airbnb为租房者提供房源...
Read More正在从加密转向AI的Cognition Labs,正寻求20亿美元的估值为其AI编码工具Devin融资。在AI初创公司估值飙升的趋势中,Cognition的成功反映了行业的增长以及在数据和计算资源上进行重大投资的重要性。像Google和Micros...
Read MoreLlama3是一种革命性的新技术,它通过使用Unsloth进行微调,可以在保持相同的计算效率的同时,显著降低VRAM的使用量。最近的研究表明,使用Unsloth微调Llama3可以使上下文长度增长六倍,这比HF的flash attention技术...
Read MorexAI公司近日宣布,其最新旗舰模型Grok-1.5已具备视觉功能,与现有最先进模型相比肩,甚至在某些方面超越。Grok-1.5的推出,标志着xAI在人工智能视觉识别领域迈出了重要一步。该模型利用深度学习技术和大量图像数据进...
Read MoreJetMoe是一个基于混合专家模型的新AI系统,通过使用公共数据集和合理的计算资源进行训练,其性能与Meta的Llama 2 7B模型相媲美,但成本仅为10万美元。这一突破性的技术成果不仅展示了在不牺牲性能的前提下降低AI模型...
Read More