研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...
Read MoreGitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...
Read More谷歌利用MaxText和Jax训练技术,同时在超过5万个芯片上进行了LLM(语言模型)训练任务,保持了66%以上的利用率,成为了最佳MFU的强有力竞争者。该项目主要基于专有技术,但其中展示了一些有趣的细节,对于其他大规模...
Read MoreCohere的最新模型是用于与真实世界的嘈杂数据互动的搜索应用的升级,以及用于检索增强生成(RAG)系统的应用。其多语言模型现在支持100多种语言,并可用于搜索同一语言内的内容(例如,在法国文档上使用法语查询进行...
Read MoreCogVLM-17B是一个开放式的视觉语言模型,具有100亿视觉参数和70亿语言参数。该模型在许多标准基准测试中表现出色,并在人类评估中表现良好。CogVLM-17B的性能优于以往的模型,将为计算机视觉和自然语言处理领域的发...
Read MoreNvidia在IEEE/ACM计算机辅助设计国际会议上发表主题演讲,介绍了一款名为ChipNeMo的大型语言模型,旨在提高芯片设计师的生产力。尽管尚未完全证明,但ChipNeMo有助于为设计工具编写脚本,总结错误报告,并为设计师提...
Read More