洋葱科技大数据岗位面试题分享

洋葱科技面试题

洋葱科技大数据岗位面试题分享

 

技术总监面试

(1)Java中单例模式有哪几种 饿汉式 懒汉式 具体 哪个线程安全 不安全的怎么处理 同步锁怎么加 锁在什么时候会释放

(2)== equals的区别

(3)Scala 样例类怎么使用 Scala 上层的类是什么 (相当于Java中的Object 的类)

(4)HDFS存储很多小文件的话,会有什么影响 如何处理小文件的问题 (压缩技术的例子 压缩之后是否支持分块 )

(5)Yarn调度器

(6)描述HDFS写数据的流程

(7)Hive中使用的数据格式

(8)Hbase热点问题 读写请求会集中到某一个RegionServer上 如何处理

(9)Linux 查看端口调用

(10)SparkStreaming 哪几种方式读取kafka数据 (receiver 和 direct)

(11)SparkStreaming 读取kafka时如何保证实时数据不丢失的问题 至多 至少(数据多一点) 精确一次

(12)如果没有实现精确一次,实现至少一次 会有重复的数据进入下游MySQL数据库 如何解决

大数据培训