在最新的研究中,科学家们介绍了一种名为LLM-FP4的新型方法,该方法能够通过在训练后将大型语言模型的权重和活动转换为4位浮点值,实现对其进行压缩。这种技术的创新之处在于,它不仅能够显著减少模型的存储需求,还...
Read MoreSAM-Med3D是Segment Anything Model(SAM)的升级版,专门针对3D医学影像进行了优化。虽然原始的SAM在处理3D医学影像时存在困难,但是经过对超过131K个3D掩模的广泛数据集进行训练的SAM-Med3D在捕捉3D空间细节方面使...
Read MoreClaude最近推出了一项新技术,该技术将其记忆库的容量提高到了100,000个令牌。此次技术升级主要通过两种技术实现了对技术文档的索引能力的提升。Anthropic公司也对此进行了全面的发布,并推出了名为'Anthropic Cookb...
Read More最近的研究表明,为ViTs注册器添加[reg]标记可以修复图像注意力映射的突增。这项工作表明,将一系列可学习的[pause]标记预置到序列中可以提高语言模型推理(仅解码器,最高可达10亿)的能力,最多可提高18%。直观上...
Read MoreSDXL是一种最先进的图像生成模型,虽然强大,但运行速度较慢。然而,Google与HuggingFace最近在Google的研究语言Jax中展示了它在新型TPU芯片上的运行速度。通过这种新的硬件加速,SDXL的性能得到了极大的提升,可以...
Read More大多数自动驾驶系统都是基于规则的、专家系统和学习模块的大规模组合。Wayve公司的最新研究展示了一个具有90亿参数的联合视频、动作和文本模型,该模型在多样化的场景中表现出色。这个模型通过学习和理解大量的驾驶...
Read More光流技术是帮助我们理解图像中物体运动的重要技术。一项新的研究利用高斯注意力(Gaussian Attention),专注于更细微的细节并更好地将它们匹配起来,从而研发出了一个名为GAFlow的模型。高斯注意力的使用,可以使光流...
Read MoreInternLM-XComposer是一个前沿的工具,能够创建文本和图片完美配合的文章。这款工具采用了先进的图像和文本理解技术,可以根据文本内容自动生成与之相符的图片,也可以根据图片生成相应的文本。此外,该工具还支持自...
Read More研究人员已经介绍了一种名为TCOVIS的在线视频实例分割技术,这种技术优先考虑时间一致性。在线视频实例分割是计算机视觉领域的热门课题,它的目的是将视频帧中的每个实例独立地识别和分割出来。然而,现有的方法通常...
Read MoreGE健康部门正在开发一款AI辅助的超声影像工具,该工具的设计目标是让没有专门训练的医疗服务提供者也能轻松使用。这款设备旨在改善医疗影像,主要关注母婴、胎儿和儿童肺部健康,以应对可以预防的母婴死亡率问题。AI...
Read More