HDFS----基于Hadoop的分布式文件系统

HDFS----基于Hadoop的分布式文件系统

HDFS----基于Hadoop的分布式文件系统

 

 

HDFS共有四个部分:

HDFS Client: 提供一些命令来管理、访问HDFS,比如启动或者关闭HDFS;与DataNode交互,读取或者写入数据;读取时,要与NameNode交互,获取文件的位置信息;写入时,将文件分成一个一个得Block,然后进行存储。

NameNode: 即Mater,管理HDFS的名称空间;管理数据块Block的映射信息;配置副本策略;处理客户端读写请求。

DataNode: 即Slave,存储实际的数据块;执行数据块的读/写操作;

 

SecondaryNode: 热备

文件读写过程:

HDFS----基于Hadoop的分布式文件系统

 

 

 

 

HDFS----基于Hadoop的分布式文件系统