Git 简介

Git是什么?

Git是目前世界上最先进的分布式版本控制系统(没有之一)。

Git有什么特点?

  1.直接记录快照,而非差异比较

    git 和其它版本控制系统(包括 Subversion 和近似工具)的主要差别在于 git 对待数据的方法。其它系统(比如 CVS、Subversion、Perforce、Bazaar 等等)将它们保存的信息看作是一组基本文件和每个文件随时间逐步累积的差异。

Git 简介

但是 git 不按照以上方式对待或保存数据。 反之,git 更像是把数据看作是对小型文件系统的一组快照。 每次你提交更新,git 都会对当时的全部文件制作一个快照并保存这个快照的索引。 为了高效,如果文件没有修改,git 不再重新存储该文件,而是用一个链接指向之前存储的文件。

git 对待数据更像是一个 快照流。

 

Git 简介

(上图中的虚线表示之前已经存储过了,不用再存储了)

  2.近乎所有操作都是本地执行

  在 git 中的绝大多数操作都只需要访问本地文件和资源。比起所有操作都有网络延时开销的集中式版本控制系统,Git 在这方面会让你感到“迅雷不及掩耳盗铃儿响叮当”。 因为你在本地磁盘上就有项目的完整历史,所以大部分操作看起来瞬间完成。这也意味着在断网环境下,几乎可以进行任何操作。 比如你在飞机上对代码做了一些修改,你能愉快地提交,直到有网络连接时再上传。 换做用 Subversion 或 CVS,你只能修改文件,但不能向数据库提交修改(因为你没网)。  

  3.保证完整性

git 中所有数据在存储前都计算校验和,然后以校验和来引用。 这意味着不可能在 git 不知情的情况下更改任何文件目录。若你在传送过程中丢失信息或损坏文件,Git 就能发现。git 用以计算校验和的机制叫做 SHA-1 散列。 这是一个由 40 个十六进制字符组成的字符串,基于 git 中文件的内容或目录结构计算出来。 SHA-1 哈希看起来是这样的:

    Git 简介

  4.一般只添加数据   

 你执行的 git 操作,几乎只往 git 数据库中增加数据。 很难让 git 执行任何不可逆操作,或者让它以任何方式清除数据。 同别的 VCS 一样,未提交更新时有可能丢失或弄乱修改的内容;但是一旦你提交快照到 git 中,就难以再丢失数据。如果你还定期把数据推送到其他仓库,那么你的数据就更难弄丢了。

git的诞生

很多人都知道,Linus在1991年创建了开源的Linux,从此,Linux系统不断发展,已经成为最大的服务器系统软件了。

Linus虽然创建了Linux,但Linux的壮大是靠全世界热心的志愿者参与的,这么多人在世界各地为Linux编写代码,那Linux的代码是如何管理的呢?

事实是,在2002年以前,世界各地的志愿者把源代码文件通过diff的方式发给Linus,然后由Linus本人通过手工方式合并代码!

你也许会想,为什么Linus不把Linux代码放到版本控制系统里呢?不是有CVS、SVN这些免费的版本控制系统吗?因为Linus坚定地反对CVS和SVN,这些集中式的版本控制系统不但速度慢,而且必须联网才能使用。有一些商用的版本控制系统,虽然比CVS、SVN好用,但那是付费的,和Linux的开源精神不符。

不过,到了2002年,Linux系统已经发展了十年了,代码库之大让Linus很难继续通过手工方式管理了,社区的弟兄们也对这种方式表达了强烈不满,于是Linus选择了一个商业的版本控制系统BitKeeper,BitKeeper的东家BitMover公司出于人道主义精神,授权Linux社区免费使用这个版本控制系统。

安定团结的大好局面在2005年就被打破了,原因是Linux社区牛人聚集,不免沾染了一些梁山好汉的江湖习气。开发Samba的Andrew试图**BitKeeper的协议(这么干的其实也不只他一个),被BitMover公司发现了(监控工作做得不错!),于是BitMover公司怒了,要收回Linux社区的免费使用权。

Linus可以向BitMover公司道个歉,保证以后严格管教弟兄们,嗯,这是不可能的。实际情况是这样的:

Linus花了两周时间自己用C写了一个分布式版本控制系统,这就是Git!一个月之内,Linux系统的源码已经由Git管理了!牛是怎么定义的呢?大家可以体会一下。

Git迅速成为最流行的分布式版本控制系统,尤其是2008年,GitHub网站上线了,它为开源项目免费提供Git存储,无数开源项目开始迁移至GitHub,包括jQuery,PHP,Ruby等等。

历史就是这么偶然,如果不是当年BitMover公司威胁Linux社区,可能现在我们就没有免费而超级好用的Git了。

速度
简单的设计
对非线性开发模式的强力支持( 允许成千上万个并行开发的分支)
完全分布式
有能力高效管理类似 Linux 内核一样的超大规模项目( 速度和数据量)
自诞生于 2005 年以来, Git 日臻成熟完善, 在高度易用的同时, 仍然保留着初期设定的目标。 它的速度
飞快, 极其适合管理大项目, 有着令人难以置信的非线性分支管理系统( 参见 Git 分支) 。