2020 BAT大厂面试经验:最全大数据+AI方向面试100题(附答案详解)
“高频面经“系列共分为五篇,数据分析篇、数据结构与算法篇、大数据研发篇、机器学习篇和深度学习篇,每篇20问,共100问。这“100问”,与其说是面试中出现频率较高的“考题”,更不如说是大数据和AI方向构建完整知识体系的“知识点”。点击下方各篇链接即可进入查阅相应参考答案,更好内容直接关注公众号“雨云飞”回复“学习资料”获取!
欢迎关注作者微信公众号:涉及数据分析与挖掘、数据结构与算法、大数据与机器学习等内容
目录
数据分析篇
数据分析主要侧重产品sence与Hive使用
目录
- Mysql中索引是什么?建立索引的目的?
- sql语句执行顺序?
- 数据库与数据仓库的区别?
- OLTP和OLAP的区别?
- 行存储和列存储的区别?
- Hive执行流程?
- Hive HDFS HBase区别?
- 数仓中ODS、DW、DM概念及区别?
- 窗口函数是什么?实现原理?
- 数仓中维度建模含义?有哪几种模式?
- Hive数据倾斜表现、原因及处理?
- 用Python怎么进行数据分析?
- 数据缺失值处理办法
- Excel中数据透视表,vlookup?
- AB测试与假设检验?
- TO C指标体系?
- 如果次留下降了 5%该怎么分析?
- 贝叶斯公式复述并解释应用场景
- CPA、CPS、CPM、CPT、CPC 是什么?
- AARRR模型是什么?
数据结构与算法篇
数据结构与算法侧重核心思路阐述和手撕代码
目录
- 什么是链表、队列、堆栈、树图?
- 删除链表中重复的节点(剑指offer 83)
- 两数相加(Leetcode 2)
- 反转链表、环形链表、合并链表
- 创建包含min函数的栈
- 二叉树的最大(最小)树深
- 二叉树的遍历
- 通过前序和中序推后序(重建二叉树)
- 二叉树的最近公共祖先(leetcode 236)
- 电话号码的字母组合(leetcode 17)
- 求1+2+...+n(剑指offer 47)
- 有效括号(leetcode 20)
- 最长公共前缀(leetcode 14)
- 排序算法有哪些?
- 快速排序实现
- 求TopK(堆排序)
- 01背包(动态规划)
- 数据流中的中位数(剑指offer 63)
- 买卖股票的最佳时机(leetcode 121)
- 矩阵中的最短路径(剑指offer 65)
大数据研发篇
大数据研发侧重组件框架原理和编程实践经验
目录
- linux常用命令
- Java虚拟机、垃圾回收机制
- TCP “三次握手”、 “四次挥手
- 大数据常见组件
- HDFS存储机制
- MapReduce基本流程
- Hadoop Shffule原理
- Hadoop常用命令
- Hadoop优化
- Hadoop分片、分区
- Hive常用高阶命令
- Redis特性
- Redis、传统数据库、HBase、Hive区别
- Kafka、Flume对比
- Spark执行流程
- Spark RDD是什么?
- Spark stage划分原理
- Spark与Hadoop区别与联系
- Flink API和流/批处理引擎
- Storm Spark-streaming Flink对比
机器学习篇
机器学习注重原理理解|算法对比及场景使用
目录
- 常见分类算法及应用场景
- 逻辑回归推导
- SVM相关问题
- 核函数使用
- 生成模型和判别模型基本形式
- ID3,C4.5和CART区别
- 交叉熵公式原理
- L1和L2正则化的区别
- 传统机器学习模型有哪些
- k-means算法流程
- DBSCAN和Kmeans对比
- LDA原理
- PCA与SVD的关系
- 推荐系统常用模型
- 协同过滤适用场景及冷启动
- Bagging和Boosting区别
- XGBoost和GDBT区别
- SGD,Momentum,Adagard,Adam原理
- 过拟合原因及解决办法
- LightGBM优势
深度学习篇
深度学习在机器学习基础上知识迭代更加迅速
目录
- 反向传播主要思想及推导
- 简要概述HMM、CRF、EM、GMM
- 衡量分类器好坏指标
- 正负样本不平衡的解决办法
- 常用**函数
- Tensorflow的工作原理
- 深度学习框架对比
- ResNet原理及与DenseNet对比
- BatchNormalization思想及作用
- 卷积层和池化层有什么区别?
- 为什么使用小卷积核而不是大卷积核?
- Faster-RCNN跟RCNN有什么区别?
- GRU、LSTM对比
- 梯度消失、梯度爆炸原因及解决方案
- Seq2Seq模型理解
- 怎么提升网络的泛化能力
- attention机制原理
- GAN网络的思想
- word2vec训练过程
- 布隆过滤器原理及场景
整体目录为:
2020 BAT大厂数据分析面试经验:“高频面经”之数据分析篇
2020 BAT大厂数据挖掘面试经验:“高频面经”之数据结构与算法篇
2020 BAT大厂数据开发面试经验:“高频面经”之大数据研发篇