由Nous研究所训练的13B参数的LongLlama-2-13B模型现在可以处理多达8k的令牌(context)。该成果是通过精细调整和线性位置插值缩放实现的。LongLlama-2-13B模型的进步标志着人工智能技术的一大步,使得处理大规模数据变...
Read More高通作为移动处理器制造商,正准备将其旗舰人工智能Llama 2模型引入到智能手机中。这一举措旨在优化手机的语言处理能力,使其在没有网络连接的情况下仍能执行复杂的语言任务。高通和Meta的这次合作,预计将为移动端...
Read More稳定性公司近日发布了一套经过指令调整的语言模型,专为研究用途而设计。这套模型采用了先进的人工智能技术,通过对大量数据进行深度学习,实现了在各种场景下的高效语言处理和理解。这将有助于推动人工智能领域的发...
Read More近年来,语言被认为是规划的强大基础。通过将强大的语言模型与需要规划的系统相结合,可以提高这些系统的性能。在一种具有挑战性的稀疏奖励环境中,这一想法得到了验证。与基线相比,所提出的方法在数据效用、适应性...
Read More近日,一项名为L-Eval的项目引起了广泛关注。该项目旨在为长篇语境语言模型提供一套标准化的评估工具。L-Eval评估套件包含了超过2000个跨领域的查询-回应对,能够全面而系统地评估各种长篇语境语言模型的性能。通过...
Read More近日,研究人员推出了一个名为SlowTV的大规模数据集,该数据集主要从YouTube收集而来,旨在提升自监督单目深度估计模型在不同环境下的深度理解能力。这些环境场景包括徒步旅行的小路、水下场景以及室内空间等。通过...
Read MoreAndrej Karpathy 编写了一个受到llama.cpp极大启发的酷炫库,可以用于纯C语言训练和推理新的Llama 2模型。这个库对于那些对底层编程感兴趣的人来说是一个很好的资源(就像他的所有代码一样)。GPT4在编写过程中给予...
Read More据报道,谷歌联合创始人谢尔盖·布林最近频繁出现在谷歌办公室,以帮助公司推进人工智能项目。布林一直在与人工智能团队合作,构建谷歌下一代人工智能模型Gemini,主要负责支持招聘流程。谷歌母公司Alphabet的CEO桑达...
Read More