日前,RSHazeNet发布,该框架旨在从遥感图像中去除雾霾。该工具使用创新模块更好地理解和保留图像中的重要细节,使其更清晰、更有用于分析。RSHazeNet框架具有较高的普适性,适用于各种遥感图像去雾任务。该工具的发...
Read More微软和太平洋西北国家实验室利用人工智能和大规模云计算发现了一种新的电池材料,这种材料是一种新型的固态电解质。与锂离子电池相比,它可能导致电池更不容易爆炸。虽然还需要测试材料是否是锂离子电池的可行替代品...
Read MoreHuggingFace发布了Datatrove,这是一个用于过滤大型文本数据集的库。它具有许多有用的原语和用于文本过滤的完整并行管道。可在C4中使用Gopher质量过滤器的示例。
Read More近日,HuggingFace发布了一个名为Nanotron的小型而强大的库,用于训练具有3D并行性的模型。这意味着它将数据、模型和模型中的层/张量分割开来。前两种并行性在PyTorch等库中得到了很好的支持。然而,将模型张量分割...
Read MoreGitHub最近推出了一款图像字幕软件,能够帮助用户为图像添加字幕以便更好地进行AI训练。这款软件非常轻巧,易于使用,可以快速准确地为图像添加字幕,提高AI的训练效率。该软件支持多种格式的图像文件,包括PNG、JPE...
Read More研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。
Read MoreOMG-Seg是一种新的模型,可以使用单个高效的系统执行各种图像和视频分割任务。与使用每个任务的不同模型的传统方法不同,OMG-Seg从图像语义到交互式视频分割处理所有内容,是一个一站式解决方案,降低了复杂性并增强...
Read More将文本描述转化为视频是当前研究的热门领域,最近几周出现了许多强大的模型。Hugging Face团队的这篇博客概述了这一任务、当前面临的挑战以及研究的现状。虽然不是完全全面的,但对于进一步阅读提供了良好的起点。
Read More