如何反转Python 3 pyspark中的RDD中的键和值?
问题描述:
这工作在Python 2.7,但在Python 3.5返回如何反转Python 3 pyspark中的RDD中的键和值?
SyntaxError: invalid syntax.
我不知道这是否有一个事实,即“元组拆包”从Python 3里删除,因为我在另一个读做帖子,或者是一个不同的问题。
rddInverted = rdd.map(lambda (x,y): (y,x))
答
尝试是这样的:
rddInverted = rdd.map(lambda x: (x[1], x[0]))
我希望它会工作
答
你的lambda函数是在RDD,这是一个元组的行。以下是你想要的。
rddInverted = rdd.map(lambda x: (x[1],x[0]))
答
解决的办法是:
rddInverted=rdd.map(lambda xy: (xy[1],xy[0]))
你能证明你的数据是什么样子? – David