Hadoop中的分区Partitioner???

参考 https://www.cnblogs.com/edisonchou/p/4297828.html

Hadoop中分区,如果不指定的话,他会使用自带的HashPartitioner

如果你业务中有需求,需要使用分区来查看文件的时候,就需要自己定义分区来使用

Hadoop中的分区Partitioner???

例如上图,需要统计手机号码的信息,就需要剔除电话号码时???

那你就需要自定义两个分区?

Hadoop中的分区Partitioner???

这时候,结果就会分为两个文件。

Hadoop中的分区Partitioner???

也许这就是 分区吧 兄die