数据科学家定位和职业规划

数据科学家(Data Scientist)定位和职业规划

来自知乎: https://www.zhihu.com/question/27946774 FAB研究所的回答
一个AI的组,需要什么样的人:
数据科学家定位和职业规划
以我周围来看,数据科学家的机会在数据工程(data engineering)方面,和商业分析(business analysis)方面是有的。建模(modelibg)方面,和机器学习研究员(ML researcher)比只有被拍死的份儿。

数据工程,我看到现在很多是研究员,或者研究员主管,以及PM一起决定,繁琐的数据采集和清理工作会外包,但是单个的研究者未必对总体数据有细致的分析;这里有机会。

商业分析涉及到商业,市场,用户,也包括和如何定量评价(metrics)的问题,这儿是有机会的。想要提出大家都认可的评价指标是蛮难的,正因如此也才有做的意义。涉及具体应用的领域,细分的评价指标可做的事情就更多了,可以说是随着产品层出不穷,如何把众多的指标抽象成工具也是可做的。

数据科学家定位和职业规划
这个图给出了数据科学家应有的技能。
Modeling: python, numpy, scikit-learn, tensorflow, pytorch
Data engineering: python, SQL or other domain-specific query languages
Business analysis: python, R, domain-specific tools (Tableau, Excel, PowerPoint, Keynote), 其实还想加一个 PowerBI
Collaboration and workflow: Git, Subversion, Merurial along with CLI such as Unix, IDE, Jupyter Notebook or Sublime

对于机器学习研究员,还有更多对研究能力的要求:
Research: following SOTA in Twitter, Reddit, Arxiv and conferences.

另一个解答

一种data analyst,就是在数据库里找数据,做dashboard / report 给别人(客户)看,(SQL要很熟);
一种是business analyst,甲方要求可能比较模糊简单,需要自己思考,发现解决问题给出答案。和上面的相比,通常这个职位没有明确方案,明确要求,更注重思考和解决问题的能力;
还有一种是data engineer,比较偏技术,编程工作量也大。要找到源数据,处理好然后放入数据库,有运维的要求;
再一种是data scientist,其实对机器学习的要求没有那么深,他不管你机器学习那些算法的。(算法工程师才是要深钻算法的那个)。

按照答主的意思,data analyst 和 data engieer是tech path;business analyst和data scientist是business path。

另一个技能图

借用这张图表示DS的发展路径
数据科学家定位和职业规划

个人的选择

数据工程师是起步,数据科学家是过度,算法工程师是目标吧。
其实职位叫什么不重要,如何在所处的环境里,挖掘别人没有发现的领域,做出自己的思考和贡献才是重要。最终自己走出怎样的职业道路,一方面是自己选择,另一方面也是环境的塑造。