Hadoop MapReduce原理笔记

1:Hadoop的核心组件–MR(MapReduce)
是一套分布式计算框架,是移动计算(而非移动数据)
MapReduce计算框架
Hadoop MapReduce原理笔记MapReduce的split大小划分原理
Hadoop MapReduce原理笔记
例如:block为64M,则不用划分block,因为block就是64M
如果block为200M,则max(min.split,min(max.split,block))=100M
所以split=100M,则200M的block需要划分为两个split。

MapReduce计算实例:统计文件中单词出现的次数
Hadoop MapReduce原理笔记Shuffler过程
Hadoop MapReduce原理笔记Hadoop MapReduce原理笔记
Hadoop MapReduce原理笔记