电商用户行为分析大数据系统
一、包含的模块
1、用户访问session分析模块:会话(session),用户的基础访问行为
2、页面单跳转化率模块:页面(page),用户的页面访问和页面跳转行为
3、各区域热门商品统计模块:商品(product),用户的商品点击行为
4、广告点击流量实时统计模块:广告(ad,advertisement),用户的广告点击行为
用户访问session分析模块
2、页面单跳转化率
3、各区域热门商品统计
4、广告点击流量实时统计
二、在实际企业项目中的使用架构:
1、J2EE的平台(美观的前端页面),通过这个J2EE平台可以让使用者,提交各种各样的分析任务,其中就包括一个模块,就是用户访问session分析模块;可以指定各种各样的筛选条件,比如年龄范围、职业、城市等等。。
2、J2EE平台接收到了执行统计分析任务的请求之后,会调用底层的封装了spark-submit的shell脚本(Runtime、Process),shell脚本进而提交我们编写的Spark作业。
3、Spark作业获取使用者指定的筛选参数,然后运行复杂的作业逻辑,进行该模块的统计和分析。
4、Spark作业统计和分析的结果,会写入MySQL中,指定的表
5、最后,J2EE平台,使用者可以通过前端页面(美观),以表格、图表的形式展示和查看MySQL中存储的该统计分析任务的结果数据。
但是在本套课程中,我们只做第三和第四点,不会做所有的部分,因为时间有限,我们只关注最重要的Spark,就是开发Spark程序。实际上,能够将Spark程序开发的很好,已经非常不错了。