转换的RDD [字符串]以JSON文件,无须转换为DataFrames [斯卡拉]
问题描述:
我在格式字符串的RDD的文件:转换的RDD [字符串]以JSON文件,无须转换为DataFrames [斯卡拉]
78656|twitterId:14|Hi|2010-05-19
我想转换此RDD [字符串]对在格式JSON文件:
tweetTable.toJSON.saveAsTextFile("Gaga")
将其转换为一个JSON文件,但T:
"78656","twitterId:14","Hi","2010-05-19"
我目前使用的代码
他的数据格式如下:
"_1":"78656|twitterId:14|Hi|2010-05-19"
有人可以帮助我吗?
答
基于你有什么的问题,你可以做这样的事情:
value <- "78656|twitterId:14|Hi|2010-05-19"
valueList <- strsplit(value, split ="\\|")
library("jsonlite")
res <- toJSON(valueList)
+0
这是Scala吗? – user2122466
+0
@ user2122466,不,它是'r',因为你在你的问题中包含'r'标记。我已经删除了额外的标签。 – SymbolixAU
' “78656”, “twitterId:14”, “你好”, “2010-05-19” 是'无效的JSON,可能你想要的东西像'{“id”:“78656”,“twitterId”:“14”,“test”:“你好”,“日期”:“2010-05-19”}'? –
你在这里使用什么语言,'python','r'或'scala'? – SymbolixAU
@VitaliyKotlyarenko:对,对不起,错字。你提到它的方式正是我想要的方式。 – user2122466