mr案例实操
代码和文件已打包上传,可先下载学习,包里分为两个文件,对应本篇的目录
mapreduce文件
1.统计文件每个单词出现次数,并分区
单词首字母a-p一个文件,q-z一个文件
文件:
效果:
2.统计每个手机号花费情况,并按手机号前三位分区
文件:
操作中要把第一行中文去掉
效果:
3.某班学生的语文和数学成绩,请将这两科成绩汇总并以姓名、总成绩两列输出到一个结果
文件:
效果:
hadoop03文件
4. 输出流量使用量在前10的用户信息
flow文件
5.map join案例
对应pro文件
6.GroupingComparator分组案例
对应pdt文件
求出每一个订单中最贵的商品
7.按照手机归属地不同省份输出到不同文件中(分区)
对应phone文件
期望输出数据
手机号136、137、138、139开头都分别放到一个独立的4个文件中,其他开头的放到一个文件中。