聊聊Hadoop:图解HDFS是个啥

Hadoop进入到2.0以后,最大的改动便是拆分出数据处理(MapReduce)和集群资源管理(YARN)部分。HDFS作为分布式储存系统在Hadoop 2.0中继续沿用。今天读了一些介绍Hadoop生态圈的文章,感觉都写得非常地学术。周末正好有兴致和时间,做了几张介绍HDFS基本信息的图,包括HDFS的用处、架构和读写文件的流程,让大家见笑啦。

聊聊Hadoop:图解HDFS是个啥


HDFS是干嘛的?

聊聊Hadoop:图解HDFS是个啥


HDFS处理文件的思路

聊聊Hadoop:图解HDFS是个啥


聊聊Hadoop:图解HDFS是个啥


HDFS架构

聊聊Hadoop:图解HDFS是个啥


HDFS读取过程

聊聊Hadoop:图解HDFS是个啥


HDFS写入过程

聊聊Hadoop:图解HDFS是个啥