Hadoop中的分区Partitioner???
参考 https://www.cnblogs.com/edisonchou/p/4297828.html
Hadoop中分区,如果不指定的话,他会使用自带的HashPartitioner
如果你业务中有需求,需要使用分区来查看文件的时候,就需要自己定义分区来使用
例如上图,需要统计手机号码的信息,就需要剔除电话号码时???
那你就需要自定义两个分区?
这时候,结果就会分为两个文件。
也许这就是 分区吧 兄die
参考 https://www.cnblogs.com/edisonchou/p/4297828.html
Hadoop中分区,如果不指定的话,他会使用自带的HashPartitioner
如果你业务中有需求,需要使用分区来查看文件的时候,就需要自己定义分区来使用
例如上图,需要统计手机号码的信息,就需要剔除电话号码时???
那你就需要自定义两个分区?
这时候,结果就会分为两个文件。
也许这就是 分区吧 兄die