Yuan 2.0-M32是一款具备40亿参数的专家混合模型,其中任意时刻仅有3.7亿参数处于激活状态。尽管其计算需求仅为Llama 3 70B的1/19,但其性能却接近后者。该模型在2万亿个token上进行了训练,展现出了令人惊讶的强大性...
Read More在工程领域,团队规模和成本往往是企业关注的焦点。一个由几百人组成的工程团队,每年的工资支出可能高达5千万至1亿美元。然而,当高管们听到工程被视为艺术,其成果难以预测时,他们感到沮丧。工程领导者和其它高管...
Read More近日,一个名为Meteor的新型高效大规模语言和视觉模型项目在GitHub上发布。Meteor模型通过引入多维度推理机制,大幅提升了理解和回答复杂问题的能力。该模型的设计旨在解决现有视觉语言模型在处理复杂场景时的局限性...
Read More模块化范数是一种全新的神经网络权重更新归一化方法,能够高效扩展不同规模网络的训练。这种方法通过调整网络的权重更新过程,确保在各种网络规模下都能保持高效的训练速度和准确性。与传统的归一化方法相比,模块化...
Read MoreCohere最新发布的Aya项目包含3种不同规模的模型,能够使用101种语言进行对话,其中许多语言资源极为稀缺。Aya项目的推出对于开放和普及研究社区来说是一个巨大的进步。通过这一项目,研究人员和开发者能够更广泛地获...
Read More由DeepMind科学家创办的AI初创公司H宣布完成2.2亿美元的种子轮融资,成为近年来最具规模的种子融资之一。这一轮融资的成功标志着法国AI人才的又一重大胜利。H公司致力于构建动作模型,这项技术有望在多个领域取得突...
Read MoreContrast是一款专为开发者设计的工具,它能够大规模地在Kubernetes上部署和管理保密容器。该工具的核心目标是确保所有数据始终加密,并且防止来自基础设施层的访问。Contrast能够无缝集成到现有的Kubernetes工作流程...
Read MoreMedLFQA是一个全新的基准数据集,旨在提升大规模语言模型在医疗领域中长篇回答的事实准确性。该数据集通过提供高质量的训练数据,帮助改进语言模型的回答精度。与此同时,OLAPH框架通过自动评估和偏好优化,训练大规...
Read More谷歌近日发布了最新模型Gemini 1.5的技术报告。报告详细介绍了此次升级的主要内容和改进之处,但并未透露过多关于模型或所使用数据的信息。然而,报告中对评估和安全措施的详尽描述,让我们得以深入了解大规模对齐的...
Read More在最近的一个Hacker News讨论串中,开发者们表达了他们对AI技术及其对自身职业生涯影响的看法。AI的进步使部分开发者感到困惑不解。他们担心自己辛辛苦苦构建的作品最终只会被大型科技公司一网打尽。AI正在以巨大的...
Read More