HDFS----基于Hadoop的分布式文件系统
HDFS共有四个部分:
HDFS Client: 提供一些命令来管理、访问HDFS,比如启动或者关闭HDFS;与DataNode交互,读取或者写入数据;读取时,要与NameNode交互,获取文件的位置信息;写入时,将文件分成一个一个得Block,然后进行存储。
NameNode: 即Mater,管理HDFS的名称空间;管理数据块Block的映射信息;配置副本策略;处理客户端读写请求。
DataNode: 即Slave,存储实际的数据块;执行数据块的读/写操作;
SecondaryNode: 热备
文件读写过程: