大数据 06 经典漫画讲解HDFS原理

http://blog.chinaunix.net/uid-27105712-id-3274395.html

分布式文件系统比较出名的有HDFS 和 GFS,其中HDFS比较简单一点。本文是一篇描述非常简洁易懂的漫画形式讲解HDFS的原理。比一般PPT要通俗易懂很多。难得的学习资料。

1、三个部分: 客户端、nameserver(可理解为主控和文件索引类似linux的inode)、datanode(存放实际数据的存server)
大数据 06 经典漫画讲解HDFS原理

2、如何写数据过程
大数据 06 经典漫画讲解HDFS原理
大数据 06 经典漫画讲解HDFS原理
大数据 06 经典漫画讲解HDFS原理

3、读取数据过程
大数据 06 经典漫画讲解HDFS原理

4、容错:第一部分:故障类型及其检测方法(nodeserver 故障,和网络故障,和脏数据问题)

大数据 06 经典漫画讲解HDFS原理
大数据 06 经典漫画讲解HDFS原理

5、容错第二部分:读写容错

大数据 06 经典漫画讲解HDFS原理

6、容错第三部分:dataNode 失效

大数据 06 经典漫画讲解HDFS原理

7、备份规则

大数据 06 经典漫画讲解HDFS原理

8、结束语

大数据 06 经典漫画讲解HDFS原理