变换具有多个字段的数据在猪

问题描述:

我有以下方式的一些数据:变换具有多个字段的数据在猪

(102,(727,103,895)) 

(102,(105,255)) 

有谁知道如何在猪这些数据转换为下面的方式?

(102,727) 

(102,103) 

(102,895) 

(102,105) 

(102,255) 
+1

可以共享代码段你有关系,B'你如何读取数据?你看到什么问题?您可以将第二个元素作为整数的元组来读取,然后使用FLATTEN来获取​​所需的数据。 –

使用FLATTEN()。假设你有两个字段

C = foreach B generate B.$0,FLATTEN(B.$1); 
DUMP C; 

enter image description here

+0

得到这个结果:(102,727,103,895), (102,105,255) – Summer

+0

原始数据很大。假设经过一些步骤,我转储B并得到(102,(727,103,895)),(102,(105,255)),然后我使用你提供的脚本,最后得到(102,727,103,895),(102,105,255)..... – Summer

+0

@夏天删除TOBAG并使用FLATTEN.I已编辑答案。 –