理解3D场景中物体的位置是一个具有挑战性的问题。然而,通过使用语言引导的3D理解,我们可以精确地为3D空间中的物体标记语义标签。语言引导的3D理解是一种新的技术,它允许我们通过使用特定的语言描述,更准确地确定...
Read More人工智能在生成艺术2D图像方面的运用早已让人们感到趣味盎然和富有创造力。而这项新的工作,将这种能力扩展到了3D领域,通过高斯喷射技术,以文本输入作为导向,使艺术场景生成更上一层楼。这种技术的出现,无疑为艺...
Read More最近,一种名为LeMeViT的新方法用于降低视觉变换器中的计算成本,其核心策略是使用可学习的元令牌。这些令牌能够有效地捕获关键信息,从而提高推理速度。视觉变换器在计算机视觉领域有着广泛的应用,然而其计算成本...
Read More谷歌DeepMind近日推出了一项名为“先锋安全框架”的新技术,以应对未来先进AI模型可能带来的风险。这个框架确定了对可能有害的AI能力的关键能力级别(CCLs),并根据这些CCLs对模型进行评估,当达到阈值时,应用缓解策...
Read More谷歌近日发布了一款名为 'Model Explorer' 的模型探索器,该工具可以帮助用户轻松查看并审查自己的模型计算图。这项新的工具对于调试和性能工程来说相当有用。Model Explorer以GitHub Repo形式存在,用户可以方便地...
Read More专家们(Experts)是一款能以最简单的方式创建并部署OpenAI助手的工具,通过将这些助手链接成工具,可以创建出一个有着扩展记忆和对细节高度关注的专家团队系统。该系统不仅能够进行深度学习,还具有高度的适应性,...
Read MoreMeta公司近日宣布发布一种名为Chameleon的全新模型,该模型可以像GPT-4o那样同时操作图像和文本。相比于许多其他的替代模型,Chameleon展现出了更好的性能。据悉,Meta团队在内部模型上已经远远超越了这项工作。该模...
Read MorexAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型,拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点,这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...
Read More