毕业论文
您现在的位置: 版本控制 >> 版本控制市场 >> 正文 >> 正文

2020最值得研究的GitforDat

来源:版本控制 时间:2025/3/26
北京白癜风医院好不好 https://auto.qingdaonews.com/content/2018-06/19/content_20138493.htm
自从Git成了码农的生活的必须之后,“一切皆Git”成了我们的口号。用git写书(GitBook),用Git日记,用Git做bug追踪(git-bug)。总之,将git当数据库,保存信息,并追踪变化成了我们大家的追求。之前虫虫文章中介绍过一个dolt一个用git作为存储的关系数据库,今天再给大家列举一下一些以GitforData为思想的工具。概述在年的今天,Git和GitHub已经涵盖了软件开发生命周期的各个方面。但是在Git存储数据库的思维才逐渐扩展开来。GitforData是什么意思?是指数据版本控制吗?如果是这样,该关心版本控制的哪些部分?是否关心回滚?可以差异Diff么?历史是怎么的,即谁改变了什么以及什么时候?怎么分支/合并?怎么与他人分享变更?是说上述内容的内容寻址版本具有该解决方案提供的所有良好分布式质量吗?是否关心Git的一些更高级的版本控制功能呢,例如临时区域或多个远程仓?是否需要在线数据目录?如果是这样,真的想要一个像开源社区一样繁荣的开放数据社区吗?是否希望能够在私有数据项目上进行远程和异步协作?是否要拉取请求,即对数据更改进行集成的人工审查?是否希望能够创建涉及某些更改或部分数据的问题?另外,此处的Data是什么意思?是指文件中的数据还是表中的数据?是说非结构化数据,例如网页中的图像或文本吗?是指CSV表还是JSONBlob?是说像时序日志条目这样的大数据吗?是说关系数据库吗?如果是关系型的,是否关心模式还是仅关心数据(反之亦然)?是指数据转换,就像数据管道中存在的转换一样吗?有应用程序吗?机器学习数据(即标记数据)?用于可视化和报告的数据?用于软件应用程序的数据?总之,“Gitfordata”不光是一个口号,还是涉及各方各面的问题。目前市面上比较符合此思想的工具,据总结总过有以下一些,总体上这些工具可分为三大类:数据目录、数据管道版本控制和版本数据库数据目录Kaggle口号:“TheHomeofDataScience”(数据科学的家)发布时间:年4月Web

转载请注明:http://www.0431gb208.com/sjszlff/9068.html

  • 上一篇文章:
  • 下一篇文章: 没有了