乐窗大数据面试题分享
乐窗面试题
(1)HDFS中的block默认保存几份?
(2)哪个程序负责HDFS数据存储?
(3)HDFS默认Block Size
(4)集群通常最主要的瓶颈是什么?
(5)关于SecondaryNameNode哪项是正确的?
A. 它是NameNode的热备
B. 它对内存没有要求
C. 它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间
D. SecondaryNameNode应与NameNode部署到一个节点
(6)一副牌52张(大小王已去掉),从中抽取两张牌,一红一黑的概率是多少?
(7)简述Apache原生Hadoop,CDH,HDP的区别。
(8)通过spark sql 将下表中的preservel字段拆分成2列,spark sql如何书写。
注:preservel中的分隔字符为普通的空格。
(9)下表是班级的考试成绩表,查询班级地理成绩第2名的姓名和ID。简述查询思路,并写出SQL查询语句。