AI21实验室近日发布了一款新型语言模型——Jamba,它采用了独特的模型结构,旨在实现比Transformers更高的效率,同时保持相当的性能水平。Jamba模型的最大亮点在于其创新性地融合了MoE(Mixture of Experts)层,这使...
Read More人工智能的近期成就归功于三个主要因素:高效机器学习算法的创新、海量数据集的支持以及半导体技术的进步带来的能源高效计算。为了保持当前的发展速度,行业需要更为强大的设备。在过去的五十年中,行业一直专注于晶...
Read More近日,英伟达的GPU在MLPerf推理测试中取得了优异的成绩,尤其是H200型号。MLPerf推理测试是业界公认的深度学习性能评估基准,对AI系统的推理能力进行全方位评测。在此次测试中,英伟达的GPU展现了其在处理复杂机器学...
Read MoreOpenAI 正在与一小群美国开发者合作,测试基于使用的 GPT 收益分享模式。这种模式可能会改变开发者与 OpenAI 之间的收益分配方式,从而激励更多的创新和贡献。测试的目标是探索如何更好地支持开发者社区,并推动 GPT...
Read MoreCreatie是一款全新的产品设计工具,它通过人工智能技术实现了产品设计流程的革新。这款工具将AI的强大算法与设计师的创意相结合,旨在提高产品设计的效率和质量。Creatie支持快速原型设计、用户界面构建和交互设计,...
Read More研究人员发现一种侧信道攻击手段,该手段通过利用加密内的令牌传输,能够以高准确率解密AI助手的特定话题聊天内容。这种攻击方法使用大型语言模型将令牌序列重构为可读文本,可能会暴露用户的敏感对话。除了谷歌的Ge...
Read MoreOPTIN框架是一个创新的方法,用于提高基于变换器的AI模型在各个领域的效率,而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术,可以在特定约束下压缩网络,同时几乎不影响其准确性。通过这种方法,可以...
Read More语言模型(LLMs)的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...
Read More