一项新的基准测试对当前先进的深度和表面法线估计模型进行了评估。这个基准测试将在众多模型中筛选出表现最优秀的,为研究者和开发者提供参考。这一进步对于提升计算机视觉技术,尤其是在深度感知和三维建模方面,具...
Read MoreLogit Lens方法已经得到了增强,该方法通过分解logit输出,帮助我们理解Transformer模型的决策过程。这种方法使用“prisms”来处理残差流,注意力层和MLP层,揭示了这些部分如何影响预测,并为gemma-2b模型执行的诸如...
Read MoreFireFunction-v2是一个开放模型,它在功能调用基准上与GPT4-o相匹配,这个模型是在Llama 3 70B的基础上训练出来的。这一模型的开发将为AI领域带来新的突破。FireFunction-v2的性能表现优秀,证明了它在处理大规模数...
Read More当前,大多数用于Transformers的计算花费在线性层上。这项工作利用muP和Monarch矩阵构建了一个结构化表示,不仅减少了计算量,而且比原始的密集层拥有更好的扩展规则。这项技术可以提高计算效率,降低运算成本,为AI...
Read MoreDatabricks近日宣布收购Tabular,此举将联合Apache Iceberg和Delta Lake的主要贡献者,专注于其湖仓架构的数据格式兼容性。此次收购的目标是实现数据互操作性的单一开放标准,以防止数据孤岛的形成。作为这一努力的...
Read MoreStability AI近日在Hugging Face Hub平台上发布了Stable Audio的权重。Stable Audio是一种训练生成音效的技术,该技术基于许可音频样本进行训练。通过这一技术,用户可以生成各种高品质的音效,应用于游戏开发、电影...
Read More模块化范数是一种全新的神经网络权重更新归一化方法,能够高效扩展不同规模网络的训练。这种方法通过调整网络的权重更新过程,确保在各种网络规模下都能保持高效的训练速度和准确性。与传统的归一化方法相比,模块化...
Read More研究人员推出了ProtT3,这是一个旨在通过结合蛋白质语言模型(PLM)和传统语言模型(LM)来增强蛋白质文本理解能力的新框架。ProtT3框架集成了用于处理氨基酸序列的PLM,并利用一种名为Q-Former的跨模态投影器生成高...
Read More