mr案例实操

代码和文件已打包上传,可先下载学习,包里分为两个文件,对应本篇的目录

mapreduce文件

1.统计文件每个单词出现次数,并分区

单词首字母a-p一个文件,q-z一个文件
文件:
mr案例实操
效果:
mr案例实操

mr案例实操

2.统计每个手机号花费情况,并按手机号前三位分区

文件:
操作中要把第一行中文去掉
mr案例实操
效果:
mr案例实操
mr案例实操
mr案例实操

mr案例实操
mr案例实操

3.某班学生的语文和数学成绩,请将这两科成绩汇总并以姓名、总成绩两列输出到一个结果

文件:
mr案例实操
效果:
mr案例实操

hadoop03文件

4. 输出流量使用量在前10的用户信息

flow文件
mr案例实操

5.map join案例

对应pro文件
mr案例实操
mr案例实操

6.GroupingComparator分组案例

对应pdt文件
求出每一个订单中最贵的商品
mr案例实操

7.按照手机归属地不同省份输出到不同文件中(分区)

对应phone文件

期望输出数据
手机号136、137、138、139开头都分别放到一个独立的4个文件中,其他开头的放到一个文件中。
mr案例实操

代码和数据文件