Kylin的入门学习

kylin的架构
Kylin的入门学习

基本操作 kylin
Kylin的入门学习
model
可能用到的维度 和可能用到的指标
Kylin的入门学习

Cube
业务中需要用到哪个指标 ,及哪个维度 有两个优化
Kylin的入门学习
优化的两部分
Kylin的入门学习
点击 这个才是正真执行
Kylin的入门学习

结果数据存储到哪个表
Kylin的入门学习

kylin适合星星模型

Kylin的入门学习
model可能用到的维度 和指标

Kylin的入门学习

cube 来源 sql ,sql根据业务
没有kylin需要计算 ,有kylin可以直接查询

kylin的底层原理 及优化

Kylin的入门学习

维度的组合 情况
n 代表维度的个数
Kylin的入门学习

kylin中没有维度 也算一个维度 ,意思是说 没有group by 也算一种
Kylin的入门学习

一种可能称为 cubeid
Kylin的入门学习
所有的可能组合 cube
Kylin的入门学习

要么是维度 要么是指标

kylin的架构
Kylin的入门学习

kylin的增量
(增量的同步)
Kylin的入门学习

增量同步时 重新编译 ,修改下结束时间Kylin的入门学习

弊端
查询数据的速度太慢了
一个sessagement 对应hbase的一张表 ,同步一个增量数据就会 生成一个sessagement

Kylin的入门学习
Kylin的入门学习
合并

自动都需要 将cube设置为 无效
手动合并
时间 连续 ,运行期间不能删除数据 ,添加数据 ,修改 ,一个sessagement可以存储多天 也可以存储一天
Kylin的入门学习

Kylin的入门学习

Kylin的入门学习
Kylin的入门学习
Kylin的入门学习
Kylin的入门学习

sessagement再合并时 不许连续合并
(多个一天的合并 ,合并了一个多天的)
有层级关系时 最好是 倍数关系
Kylin的入门学习

删除
Kylin的入门学习

Kylin的入门学习

Kylin的入门学习

自动删除

设置保留的时间 ,过了保留的时间后自动删除
设置保留几天,设置保留的天数就会自动删除

Kylin的入门学习
Kylin的入门学习

用IDEA访问kylin时 只需要关注项目名

kylin Cube的优化
Kylin的入门学习

查新cubeid 有多少个的命令
bin /kylin.sh org.apache.kylin.engine.mr.common.CubeStatsReader cubeid名字
在这里插入图片描述Kylin的入门学习
Kylin的入门学习

kylin优化有三种
1用不到的情况排除
2有层级的直接使用最后一层
3 不计算衍生维度的那种组合情况

kylin 维护 主键 和非主键 进行映射
原始的

衍生维度

衍生的维度排除计算 那种可能

Kylin的入门学习
第一种的结果
Kylin的入门学习

第二种
Kylin的入门学习
第二种的结果
Kylin的入门学习

分枝剪裁
123
聚合组
Kylin的入门学习

一种什么都不做
一种选着层级组合