MapReduce的自定义数据类型、top-N、二次排序、多表连接案例——千峰视频
MapReduce自定义数据类型
到此,自定义的类型已经OK了。
MapReduce的top-N
统计完数据后,再调用刚刚自己写的方法进行获取前几名
导出jar包,放到home目录下面,然后就是造数据
到此,获取前几个的也就OK了。
MapReduce的二次排序
到此,自定义数据类型就可以了。
然后写一个Delme
也就是首先写一个自定义类型,然后写一个MapReduce,Map端的输出key是自定义数据类型
现在就可以导jar包,将包拉到home目录下,上传到根目录下。
创造数据
到此,排序就搞定了。
MapReduce多表的join连接
添加setUp,执行map之前先执行setup
然后就可以导出jar包,然后拷贝到home目录下
到此,多表关联就OK了。