知道创宇大数据面试题

知道创宇

知道创宇大数据面试题

 

(1)为啥用rdd不用DF或者是DS

(2)sparkstreaming窗口函数处理数据时,如果我处理近一个小时的数据,但是出现上一个小时数据如何处理

(3)sparkstreaming处理数据时,出现kafka消费数据延迟,出现上一个小时数据,如何处理

(4)scala和java相比开发spark的优点

(5)你对隐式函数的了解,能看懂隐式函数吗?

(6)如何实现topn

(7)如何实时更新topn

(8)你们需求谁提的,目的是啥

大数据培训