乐窗大数据面试题分享

乐窗面试题

乐窗大数据面试题分享

 

(1)HDFS中的block默认保存几份?

(2)哪个程序负责HDFS数据存储?

(3)HDFS默认Block Size

(4)集群通常最主要的瓶颈是什么?

(5)关于SecondaryNameNode哪项是正确的?

A. 它是NameNode的热备

B. 它对内存没有要求

C. 它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间

D. SecondaryNameNode应与NameNode部署到一个节点

(6)一副牌52张(大小王已去掉),从中抽取两张牌,一红一黑的概率是多少?

(7)简述Apache原生Hadoop,CDH,HDP的区别。

(8)通过spark sql 将下表中的preservel字段拆分成2列,spark sql如何书写。

乐窗大数据面试题分享

 

注:preservel中的分隔字符为普通的空格。

(9)下表是班级的考试成绩表,查询班级地理成绩第2名的姓名和ID。简述查询思路,并写出SQL查询语句。

乐窗大数据面试题分享

大数据培训