如何在pyspark中创建列表的数据框的元组的数据框?
问题描述:
这里是我的数据框:如何在pyspark中创建列表的数据框的元组的数据框?
my_df.show()
+----------+
| features|
+----------+
| [0,'a'] |
| [1,'b'] |
| [0,'c'] |
| [1,'d'] |
| [2,'e'] |
| [0,'f'] |
+----------+
如何将它转换成一个元组的数据框(单柱“功能”)?
答
尝试
my_df.map(lambda x: (x[0],x[1]))
你可能想扩大你的答案,或许表明结果是什么,并解释为什么它是如此。 – buruzaemon