列拆分为多行帮助文档

列拆分为多行步骤是将输入数据行集中的某个列按照条件拆分为多行。这种条件可以是简单的一个分隔符,也可以指定正则表达式。配置信息如图1所示。

                 列拆分为多行帮助文档

 

                                                    图1 列拆分为多行步骤的配置信息

 

下文详细解释各控件的含义:

1、转换步骤名称:步骤的名称,在单一转换中,名称必须唯一。

2、要拆分的字段:从输入流中指定拆分的字段,可下拉选择。

3、分隔符:拆分字段时,使用的分隔符。一般情况下,分隔符划分的每一个字符串片段,都将成为一个新行。如果控件4被勾选,分隔符实质就是一个正则表达式。例如:勾选控件4后,指定分隔符为ab*,客户端就会将ab*识别为一个正则表达式,在字符串中就能匹配“a”,也能匹配“ab”以及“abb”。“*”号等价于{0,}。

4、分隔符是一个正则表达式:如勾选,控件3就是正则表达式。否则,不管控件3中的字符串是何内容,客户端都只是将其当成一个分割文本的字符串。

5、新字段名:指定列分割后形成的新字段名称。输出的数据行集将包含这个新的列,列的值为分割后形成的字符串片段。

6、输出中包括行号:如勾选,则在输出的数据行集将包含一个行号列。

7、行号字段:指定行号字段的名称。

8、对接收到的每一行重置行号?:如勾选,则输入的数据行集中每一行都将独享一个行号序列。

例如:

数据行集为:

列拆分为多行帮助文档

 

经过拆分之后的输出数据行集的行号为:

列拆分为多行帮助文档

 

文章原创首发于:https://ckettle.ccsaii.com.cn/help/StepPluginType/SplitFieldToRows3?s=****

更多CKettle内容,欢迎点击上述链接学习。