在人工智能产业中,数据资产是最容易被忽视的管理内容,而且随着业务的不断深入和递进,数据及其标注都在不断地增加和更新。在传统的管理方式中,每一次更新往往伴随着数据的一次全量复制和一次手动版本记录,由此引发的数据膨胀及衍生问题,往往需要耗费一个企业20%以上的时间和精力,在数据浩繁的自动驾驶领域所耗更甚,同时带来的,还有指数级增长的数据存储成本。
git工具的出现,大大提高了代码版本管理的效率,提升了软件开发行业的整体效率。在这样的背景下,AI基础设施建设者格物钛提出了“像使用git管理代码一样管理数据”的概念,并开发了对应的非结构化数据平台。
格物钛数据平台能够帮助统一包括原始数据、元数据以及标注在内的所有信息格式,使得数据的版本管理变得轻量化,摆脱复杂冗余的传统文件夹版本管理方式,无需复制大量数据,只需要通过一键
转载请注明:http://www.0431gb208.com/sjszlff/7746.html