开源|Egocentric-10K:全球最大规模工业操作视频数据集发布
talkingdev • 2025-11-11
5816 views
由builddotai团队在Hugging Face平台开源的Egocentric-10K数据集,标志着工业视觉与机器人学习领域取得重大突破。该数据集包含10,000小时以第一人称视角采集的工业操作视频,涵盖192,900个视频片段,真实记录了2,138名工人在实际工厂环境中完成各类生产任务的完整过程。作为目前全球规模最大的手部可见性与主动操作数据集,其核心价值在于提供了工业场景下精细动作分析的标准化基准,将显著推动人机协作、动作识别算法、工业数字孪生等前沿技术的发展。该数据集通过真实场景的大规模标注数据,解决了传统计算机视觉模型在复杂工业环境中泛化能力不足的痛点,预计将为智能制造、机器人模仿学习、AR远程指导等应用场景提供关键数据支撑。
核心要点
- 包含10,000小时第一人称视角工业操作视频,覆盖192,900个标注片段
- 真实采集自2,138名工人在实际工厂环境中的操作数据
- 专注手部可见性与主动操作分析,推动工业视觉与机器人学习发展