hdfs的读流程

hdfs的读流程
hdfs的读数据流程

(1) 客户端通过Distributed FileSystem向NameNode请求下载文件,NameNode通过查询元数据来知道所要下载的文件是否存在,如果存在就会找到文件块所在的DataNode地址。
(2) 挑选一台DataNode(就近原则,然后随机)服务器,请求读取数据。
(3) DataNode开始传输数据给客户端(从磁盘里面读取数据输入流,以packet(64kb)为单位来做校验)。
(4) 客户端以packet为单位接收,先在本地缓存,然后写入目标文件。
(5) 客户端将所有的块下载下来之后,在本地将所有的块拼接成一个文件。