近期,Triton手写常见模型梯度加速 AI 训练的项目备受关注。该项目手写了一些常见模型的梯度,以加速训练过程。尽管该项目的基准测试结果并不是最具说服力的,但这是一项非常值得尝试的努力。根据测试结果,该项目能...
Read More近日,HuggingFace 发布了最新版本的 Transformers 4.36.0。此次更新新增了 Mistral 模型和 AMD 支持等多项功能。同时,safetensors 已成为默认设置。HuggingFace 的这次更新将为 AI 模型的开发和训练提供更加便利的...
Read More本项目深入探讨了使用无监督模型在真实世界图像中分割目标的困难。目前,无监督分割技术仍存在一些挑战。首先,图像中的目标可能具有不同的形状和大小,需要针对不同特征进行分割。其次,图像中可能存在噪声、光照变...
Read MoreKwaiAgents是一个先进的代理系统,使用大型语言模型来模仿人类认知技能。该系统可以应用于自然语言处理、语音识别等领域。KwaiAgents的开放源代码已经上传至GitHub平台,使得更多的研究人员可以参与到该项目中来。该...
Read More近日,研究人员开发出了一种专门为生物应用设计的视觉模型BioCLIP。实验结果显示,在特定的生物任务上,BioCLIP的表现比OpenAI的clip高出近20%。此外,BioCLIP还提供了一个由1千万对图像和文本构成的训练集。 事实...
Read More空间-时间多样化网络(STDN)是一种新型模型,通过探索帧内的空间特征和时间上的关联关系来捕捉视频中的多种线索。STDN模型可以同时捕捉视频中的动作、外观、场景和对象等多种信息,从而实现更准确的视频分类。此技...
Read MoreMeta最近发布了一篇关于音频AI基础模型的论文,并发布了更多的样本和引人入胜的演示。该项目的主要目标是生成可控制风格的音频内容,所有风格都来自同一个模型。
Read More近日,麻省理工学院的Liquid AI致力于构建全新类型的人工智能,称之为液态神经网络。相比传统的人工智能模型,液态神经网络更小,需要更少的计算能力来运行。这意味着能够在更广泛的应用中使用液态神经网络。该公司...
Read More