1.kettle知悉

1.kettle是一种etl工具
2.
–抽取(Extract):一般抽取过程需要连接到不同的数据源,可能是业务系统的数据库,肯能是数据文件,可能是页面.看上去简单,其实是复杂繁琐的过程,因为数据源的数据格式可能是不规范的,所以在抽取数据的时候比较麻烦,
–转换(Transform):任何对数据的处理过程都是转换。通常包
括下面一些操作:
a.移动数据
b.根据规则验证数据
c.数据内容和数据结构的修改
d.将多个数据源的数据集成
e.根据处理后的数据计算派生值和聚集值
–加载(Load):将数据加载到目标系统的所有操作。
1.kettle知悉