近日,GitHub上发布了一款名为SurgeNet的创新性手术基础模型,该模型在外科计算机视觉领域树立了新的标杆。SurgeNet通过先进的深度学习技术,能够高效处理复杂的手术场景数据,为外科医生提供更精准的视觉辅助。该模...
Read More近日,一款名为'landmarker'的Python工具包正式发布,该工具包基于PyTorch框架,旨在为地标定位算法的开发与评估提供灵活的工具支持。'landmarker'不仅简化了算法的实现过程,还提供了丰富的评估功能,帮助研究人员...
Read MoreNVIDIA近日发布了一项创新技术FoundationStereo,该技术将基础模型与立体匹配技术相结合,旨在提升机器人和自动驾驶车辆的3D感知能力。通过这一技术,设备能够更精确地理解和处理三维环境中的信息,从而提高导航和操...
Read MoreMeta人工智能研究实验室(FAIR)近期宣布分享一系列新的研究成果、模型和数据集。这些资源旨在推动人工智能领域的研究和创新。新共享的资源包括经过优化的机器学习模型、旨在提升算法性能的数据集,以及前沿的研究成...
Read MoreSkyvern,作为YC S23的一员,最近正式推出。该项目是一个开源的AI代理,旨在简化浏览器自动化的过程。Skyvern结合了先进的机器学习技术,能够帮助用户自动执行各类在线任务,如表单填写、数据抓取和网页导航等。这一...
Read MoreLlama 3.2 是一款全新的开源可定制模型,旨在推动边缘AI和计算机视觉的发展。该模型的设计能够灵活适应多种应用场景,从智能监控到无人驾驶汽车,Llama 3.2 提供了强大的支持。其核心优势在于可定制性,使开发者能够...
Read More最近,研究人员推出了一种新的图像和视频分割模型——SAM 2,能够从图像和视频中精确地分割出任何物体。该模型采用了全新的分割框架,能够利用少量训练数据进行高质量的物体分割。SAM 2 的分割精度得到了显著提高,比...
Read More研究人员宣布了一个新的数据集,其中包含了一个拥有1万亿令牌的多模态数据集。该数据集包括图像、音频和文本数据,并可用于训练人工智能算法。通过使用这个数据集,研究人员可以更好地理解人类语言和视觉系统的工作...
Read More科研人员最近提出了一种新的视频立体匹配方法,该方法通过确保时间连续性,增强了深度估计的能力。立体匹配是计算机视觉中的一个核心任务,主要用于恢复场景的深度信息。新的立体匹配方法在处理视频内容时,特别强调...
Read More无监督概念提取(Unsupervised Concept Extraction,简称 UCE)是一项新的技术任务,它能从单张图片中提取并重建多个概念,无需任何人工注释。这种方法的优点在于,它能从大量的无标签数据中自动提取有价值的信息,...
Read More