苹果研究人员使用创新的闪存利用技术,在苹果设备上部署大型语言模型取得了关键突破。该方法采用窗口化和行列捆绑技术,以最小化数据传输并最大化闪存吞吐量。它可以使AI模型在标准处理器上运行速度提高高达5倍,在...
Read MoreGoogle的Gemini语言模型项目已经发表了一篇850多位作者的论文。该论文详细阐述了Gemini语言模型的研究成果,但缺乏关键的架构和数据集细节。该论文还提供了有关归因和评估的详细信息。
Read More苹果研究员使用一种创新的闪存利用技术,为在具有有限内存的苹果设备上部署大型语言模型打开了关键突破。该方法使用窗口化和行列捆绑技术来最小化数据传输,最大化闪存吞吐量。它使得 AI 模型在标准处理器上运行速度...
Read MoreM3DBench是一个全新的广泛数据集,旨在改变AI的3D理解,填补多模态语言模型研究中的差距。它包括超过320,000个不同的指令响应对,集成了文本、图像和3D对象,为AI执行更广泛的现实3D任务铺平了道路。
Read More近日,一项名为LLMLingua的新项目在GitHub上开源。该项目使用对齐后的小型语言模型检测提示中的无关标记,并实现对黑盒LLM的压缩推理,从而实现了高达20倍的压缩比,且性能损失最小。简言之,LLMLingua能够帮助开发...
Read MoreGoogle的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...
Read More一家名为whiterabbitneo的新公司,这个名字是对电影矩阵的一个引用,已经发布了一个包含13B参数的语言模型,旨在为攻击和防御网络安全提供帮助。它经过训练,可以回答关于计算机安全的问题并提供相关信息。
Read More本文讨论了一种主动评估语言模型潜在歧视影响的方法。该方法包括为各种决策场景和人口统计信息变化生成广泛的潜在提示。减少正负歧视的策略主要涉及仔细的提示工程。一些大型科技公司已经开始在其算法中采用这种方法...
Read More