一.Git是如何识别对象的

所有的对象都以SHA值为索引用gzip格式压缩存储, 每个对象都包含了对象类型, 大小和内容.

你可以在Git里的 \.git\objects\目录下这种用gzip格式压缩存储的“40个字符”字符串文件的对象。

Git工作原理

git是通过一个40个字符的（40-digit）“对象名”来索引的，对象名看起来像这样:

2683010724f10b0ee0994e19b67713e7800be7

每一个“对象名”都是对“对象”内容做SHA1哈希计算得来的，（SHA1是一种哈希算法）。这样就意味着两个不同内容的对象不可能有相同的“对象名”。

这样做会有几个好处：

1.Git只要比较对象名，就可以很快的判断两个对象是否相同。

因为每个仓库（repository）计算“对象名”的算法完全一样，所以“对象名”不同，必定对象内容不同，如果同样的内容存在两个不同的仓库中，就会存在相同的“对象名”下。

2.Git还可以通过检查对象内容的SHA1的哈希值和“对象名”是否相同，来判断对象内容是否正确。

二、git中的两种对象

Git中存在两种对象 - 松散对象(loose object)和打包对象(packed object).

1、松散对象(loose object)：它就是磁盘上的一个存储压缩数据的文件. 每一个对象都被写入一个单独文件中.

你可以在.git\objects\2a目录下找到松散对象2683010724f10b0ee0994e19b67713e7800be7(SHA为2a2683010724f10b0ee0994e19b67713e7800be7)

Git工作原理

Git使用SHA值的前两个字符作为子目录名字, 所以一个目录中永远不会包含过多的对象. 文件名则是余下的38个字符

SHA值是文件内容的一个引用(译者注: 相当于指针指向对应的块对象).

我们可以使用cat-file命令去查询特定对象的信息. 注意下面只键入了SHA值的一部分, 不必把40个字符全部键入:

Git工作原理我们可以看到上图中的对象类型为tree，一个树(tree)对象可以引用一个或多个块(blob)对象, 每个块对象都对应一个文件. 更进一步, 树对象亦可以引用其他的树对象, 从而构成一个目录层次结构. 每一个提交都对应一个树对象。你可以使用ls-tree去查看树的内容:

我们可以看到2a683010 tree对象下有如下内容

Git工作原理

一个"块"(blob)即是文件的数据, 我们可以用cat-file查看其内容:

Git工作原理

注意文件内容可能是旧的

所有的对象都使用SHA1值作为索引存储在git目录之下，这些文件的内容其实是压缩的数据外加一个标注类型和长度的头. 类型可以是块(blob), 树(tree), 提交(commit)或者标签(tag).

我们可以用.git/HEAD找到HEAD提交

Git工作原理

把HEAD转换到dev分支

Git工作原理

然后.git/HEAD

Git工作原理

上面的输出告诉了我们现在在哪个分支之上工作.

Git通过创建.git目录下的文件去标识分支(译注: 即refs/heads下面的文件, 多个分支会有多个文件). 每个文件中包含了一个提交的SHA1值, 我们可以用cat-file去查看此提交的内容(译注: 此提交即为该分支的头):

我们看一下\.git\refs\heads目录，可以看到有两个HEAD提交文件dev 和 head

Git工作原理

我们一起来看一下master提交文件里面有什么

Git工作原理

parent（父对象）指向了前一个提交:。

Git工作原理