近日,GitHub推出了一项新的方法,可以增强OpenFlamingo和LLaVA等多模型模型对视觉对抗攻击的防御能力。该方法通过无监督地微调CLIP视觉编码器,有效地保护这些模型免受恶意图像攻击,提高了它们在现实应用中的可靠...
Read MoreGitHub上发布了一个名为“Flexible Vision Transformer”的仓库,该架构设计用于创建任意分辨率和纵横比的图像。与传统模型不同,FiT将图像视为变量大小的标记序列,在训练和推理过程中更有效地适应不同的图像大小。这...
Read MoreSasha Rush发布了一份注释教程,介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误,它目前无法扩展,但它是技术的极端演示,并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...
Read MoreContextual团队发布了一种能够同时生成文本和嵌入式编码的模型,名为生成式表征指导调整模型(Generative Representational Instruction Tuning)。该模型在多模态领域表现出色,远远超过了单一专家模型。这种模型的...
Read More本文介绍了LoRA+,一种优于现有Low-Rank Adaptation (LoRA)方法的微调大模型的方法。LoRA+通过为过程中的关键部分使用不同的学习速率来实现更好的性能和更快的微调,而无需增加计算需求。
Read MoreScribe近日完成了由红点风投领投的B轮融资,以加速其基于人工智能的平台的发展。该平台自动化创建视觉化的分步指南,促进组织内知识共享。超过100万个团队使用Scribe,其中包括97%的财富100强企业。该公司正在扩展其...
Read More据报道,软银集团创始人孙正义正在推出Izanagi,一个旨在与Nvidia竞争并专注于人工智能应用的1000亿美元芯片创业公司。Izanagi的目标是利用孙正义在AI和5G技术领域的经验来打造出一种全新的芯片,以满足未来的需求。...
Read More根据OpenAI平台上的新文档,GPT-4模型的训练数据已更新,包括了截止于2023年12月的信息。GPT-4是一种自然语言处理模型,它可以生成人类能够理解的语言。这一更新表明,GPT-4将有更多的信息可用于训练,以更好地理解...
Read More