新美互通大数据技术岗相关面试题分享
新美互通面试题
(1)简单的自我介绍一下?
(2)用的什么架构?都用了哪些件?
(3)Flume你了解得多吗?
(4)是你来维护Flume吗?
(5)面试官:我们公司没用过Flume,以后的话可能会用到,有这个计划。
(6)为什么前面Flume不直接到HDFS上,中间要用Kafka呢?
(7)原始文件在HDFS上,那数据应该清洗格式化之后才能放到Hive吧?
(8)中间是写的MR吗?
(9)HBase一般放什么数据?
(10)整个流程都是你一个人维护吗?
(11)你们的数据量是多大?
(12)HDFS的集群的物理机有多大?
(13)面试官:我们不做国内的数据,做国外的数据。
(14)你有没有做过数据计算方面的任务,统计方面的任务,自己去调研自己的数据是否合理类似于这种计算?
(15)计算资源不够的问题?
(16)Spark计算写的多吗?
(17)你代码写的多吗?还是主要写SQL?还是写脚本?
(18)你为什么离职呢?
(19)你对下一份工作有什么要求吗?