RDD之键值配对的连接变换

     连接变换

         join           内连接

         rightOuterJoin 右连接 

         leftOuterJoin  左连接

         cogroup        全连接

         subtractByKey  减连接

cogroup 和subtractByKey  得到的是一个迭代器,要再将它循环输出多次,直至得到值

                      RDD之键值配对的连接变换

                以下是得到的结果

                    RDD之键值配对的连接变换

    这里截图分开了,自己看着拼起来

             RDD之键值配对的连接变换

总结:

       join(内连) : data1和data2中都有的相同的键的话,那么会将它们一起组合起来,它们的值将会放在一起

      rightOuterJoin(右连) : 顾名思义,以右边为主,如果data1和data2中各有不同的键组,那么会在以内连的情况下把data2中和data1的不同的键组输出,因为data1中无这个键组,所以用None代替,而且None要写在前面。

       leftOuterJoin(左连) :和右连一样,只不过是以左边为主,这里这个None要写在后面

       cogroup(全连) :这个相当于右连和左连的集合体,所有的都会输出,得到的值是个迭代,要使用for循环来输出

       subtractByKey(减连):把data1中和data2中相同的减掉,还剩下的就是结果,不考虑data2中和data1中不同的,得到的结果也是个迭代,要用for循环后再输出一下