研究了500+数据科学面试问题之后,我发现了这些规律……

全文共1997字,预计学习时长8分钟

 

研究了500+数据科学面试问题之后,我发现了这些规律……

图源:pixabay

 

如果现在去参加数据科学面试,你有信心所向披靡吗?得益于一些数据科学训练营毕业生、Zoom和万维网,我接触到了无数关于数据科学面试的问题。几个月的实践教会了我很多东西,不仅仅是数据科学,还有关于自信、努力工作和通过网络建立关系的能力。

 

关于数据科学面试,你要准备的还有很多。

 

研究了500+数据科学面试问题之后,我发现了这些规律……

 

“什么是数据科学?”

 

在参加数据科学训练营时,我觉得自己已经掌握了大多数主题。但是,当回答关于关键主题和模型的概念性问题时,我才意识到自己的知识盲区。

 

在知识渊博的同事面前回答概念性问题很有价值的。从大学时,我就发现和别人一起学习是个好主意。当你一个人的时候,你很容易说服自己略过已知的话题,但是回答朋友的问题将测试和巩固你的知识。

 

研究了500+数据科学面试问题之后,我发现了这些规律……

图源:unsplash

 

我建议找一个已经在这个领域工作的人,或者找一个同样想进入数据科学领域的人,通过解决一大堆概念性问题,为面试做准备,增强你的数据科学知识和理解能力。研究过不同网站上的说法之后,我列出了一些我认为“经典”概念问题:

 

· 定义机器学习。

· 什么是整体模型?

· 解释离散变量与连续变量?

· 你如何处理数据中的缺省值?

· 阐述树状结构是如何工作的?

· 什么是PCA?你什么时候使用它?

· 什么是I型和II型错误?并举个例子。

· 数据科学中的偏差/方差折衷是什么?

· 有监督和无监督机器学习有什么区别?

· 解释过度拟合和欠拟合?你如何减少这些?

· 解释什么是交叉验证,以及为什么使用它?

· 解释说明性、预测性和说明性模型之间的差异?

· 引导完成探索性数据分析的一般步骤,你在此阶段的项目中寻找什么?

 

你能很好地回答这些问题吗?是时候找个帮手了。可以是一本教科书,或者更可能是Google。我不会提供我的答案,因为我发现寻找答案,与他人进行讨论和辩论,然后自己得出答案,这是一个非常有价值的学习过程。

 

互联网上有足够多的编码问题和挑战,够你练习一阵儿了。对于数据科学家来说,精通编程非常重要。但我认为,数据科学家的价值更多体现在他们在该领域的知识以及应用该知识的能力。

 

你可以一直上Python的速成课程,重温学习R语言,或搜索公式为95%的置信区间。但如果你对基本的数据科学概念没有信心,当想着手开始第一个项目的时候该从何开始呢?

 

研究了500+数据科学面试问题之后,我发现了这些规律……

 

网络和全面发展的重要性

 

前文提到了,在亲人的介绍下我与一组数据科学训练营毕业生建立了联系。他们通过Zoom互相回答数据科学的面试问题,时间为一小时,每周三次。

 

研究了500+数据科学面试问题之后,我发现了这些规律……

图源:unsplash

 

刚开始的时候,我很积极地加入他们的Zoom通话。我的训练营还没有结束,有一半的时间我既不理解问题也不知道答案,我会糊弄出一个简单的答案,或者根本无法给出答案。

 

过去,我对互联网也有类似的感觉。这让人感到很为难不舒服,而且往往也没有达到立竿见影的效果。但是,Zoom教会了我坚持使用它的价值。在这些电话会议上,那些数据科学家已经成为我不可思议的资源。我认为,当网络互利互惠且更像是建立关系时,与仅仅获得名片或LinkedIn连接相比,所花的精力要少得多。

 

此外,还有一项更为关键的挑战,是我能为更有把握地去面试能做到,但实际上却没有做到的。它最终成为我过去几个月的重要一课:全面学习的重要性。

 

我看到过将“数据科学独角兽”一词用于职位描述的情况,雇主希望聘用一位可以做所有事情的数据科学家。尽管这种期望是不现实的,但成为数据科学家通常确实有很多不同的要求。因此,在申请工作时,专注于在所有这些领域中培养技能非常重要。

 

我发现想成为数据科学家,我需要花时间来扩展我的编码知识,以此加深我对统计和数学的理解,还要更多地了解数据科学概念,以及练习将这些东西传达给更多以业务为中心的读者。这都需要时间。

 

你不能期望自己在短短几个月内深入了解这些所有的领域,我的新手训练营时期从最初的5个月的目标发展到总共7个月的时间,我很高兴能花时间放慢脚步,真正了解事物,并通过撰写文章和在LinkedIn上变得更加活跃来建立网络联系。

 

研究了500+数据科学面试问题之后,我发现了这些规律……

图源:unsplash

 

或许你已经称得上是一个“数据科学独角兽”,但可能还有哪些方面可以查漏补缺呢?希望本文对你成为数据科学家的旅程有所帮助。下面是我所研究的那数百个问题链接,学习愉快~

 

· 数据科学面试问答:https://www.springboard.com/blog/data-science-interview-questions/

· 2020年您必须准备的100多个数据科学面试问题:https://www.edureka.co/blog/interview-questions/data-science-interview-questions/

· 数据科学面试问题TOP 30:https://towardsdatascience.com/top-30-data-science-interview-questions-7dd9a96d3f5c

· 超过100位数据科学家面试问答:https://towardsdatascience.com/over-100-data-scientist-interview-questions-and-answers-c5a66186769a

· 2020年排名前210个的机器学习面试问答:https://www.gangboard.com/blog/machine-learning-interview-questions-and-answers

 

研究了500+数据科学面试问题之后,我发现了这些规律……

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

研究了500+数据科学面试问题之后,我发现了这些规律……

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)