转行数据分析师,必须了解的基本常识
这几年随着大数据和人工智能的发展,所有行业,尤其是传统行业面临着巨大的变革。按照目前社会精英阶层的判断,第四次工业革命能即将到来,这就意味着大量从业人员将面临巨大的下岗风险。事实上,这种现象已经初见端倪。
数据分析师这一职业就是在这一大背景下才逐渐发展火起来的,但真正将之视为专门的岗位来对待的,实际上不过6年左右的时间。因此,称之为蓝海,目前来看还是可信的。
从这6年的发展过程来看,数据分析师行业存在两个明显的特点,首先是发展缓慢,其次是行业规模尚未形成,因此尚属于小众行业。这与数据分析师的准入门槛过高是有直接关系的,**并不是什么人都适数据分析这一岗位,也并不是什么人都能够成为数据分析师。**其中最基本的一条:需要学统计分析的理论,就能把绝大部分人拒之门外。
总的来收,想要入门数据分析师,你要理解数据分析师是干什么的,数据分析师和程序员的区别是什么,以及需要学习的框架是怎么样的,然后再根据自身条件判断是否适合学习数据分析。
什么是数据分析师
就纯数据分析师的角度来看,其主要职责基本上是通过数据挖掘为企事业单位的决策提供支持,因此数据分析师的服务对象有可能是企业中的各个业务部门,也有可能直接面向领导。单单从这一角度来看看,数据分析师就必须要与程序员的性质区分开来。
当然现在还有一个新的趋势,即“数据分析+岗位”的正在逐渐增多。比如前几年比较热门的产品经理岗位,由于准入门槛过低,最终导致行业人才良莠不齐的现象非常严重。近几年随着大数据的迅猛发展,逐渐出现了“数字化产品经理”的Plus版人才,相比于传统人才,数字化产品经理能够基于数据分析结论指导产品研发,提升了研发效率、研发可靠性、并降低了研发成本,因此无论从能力上,还是技术上都更具竞争力,其工资水平也达到了行业平均的2倍以上。
**从性质上来看数据分析师有点像古代的“军师”。**军师分两种:一种是郭嘉类型的,善于帮领导做决断;另一种是荀彧型的,善于帮领导做谋划。这两种类型其实也适用于区分数据分析师的类型:一种是业务支持型的,通过业务数据的挖掘为企业精细化运营做研判;另一种是预测规划型的,通过模型算法的预测,为企业资源的提前配置提供决策支持。
数据分析师的分类
数据分析师的类型划分,目前比较全面且符合企业用人需求的划分方法是**业务数据分析师、算法工程师、大数据分析和人工智能工程师四类,**虽然在此基础上还有数据科学家这一层级的存在,但前四类基本能够囊括目前95%以上的岗位。
上述提到的每个类型都是后续类型的基础,人工智能和数据科学家就不说了,毕竟基本上大企业才有这个需求,也才可能出现数据科学家这样的存在,对于大部分人而言前3个类型是可以考虑的学习的方向。
数据分析师的具体工作
**业务类数据分析师:**主要负责现状数据的挖掘和分析,举个简单的例子方便理解,比如某公司上个季度的销量下降,下降的主要原因是什么,这就是业务数据分析师必须要回答的问题。
**算法工程师:**除了业务数据分析师的工作内容外,算法工程师需要掌握机器学习算法,对模式和发展趋势进行挖掘,举个简单的例子,某个产品有完整的历史销售记录,决策层想要知道下个季度的销售量能够达到什么样的水平,这就是算法工程师必须能回答的。
**大数据分析师:**大数据分析师的本质依然是算法工程师,却别是大数据分析师掌握了一套专门用于处理海量数据的工具。
数据分析师的学习陷阱
数据分析能否自学?答案是肯定的,但自学成才的比例相当低,即使大学本科专业学4年数据分析,或者研究生学3年学数据分析,出来的往往也只是入门级别的,这一点相应很多学生或用人单位深有感触。
很多人问我,为什么学了2年数据分析还是一头雾水?这里面有一个难点和一个陷阱需要注意。首先说下陷阱,要理解这个陷阱依然需要深刻理解程序员和数据分析师的真正区别,很多人在入门时最容易犯的错误就是把数据分析==工具分析,如果按照这个思路起步,那么你最终会沦落为程序员,而不是数据分析师。么怎样能规避这个陷阱呢?这就要说到自学过程中的一个难点,这个难点就是如何有效地将数据分析思维和业务分析思维地结合到工具的学习过程中来,只有这样才能避免工具化的学习陷阱。想想简单,但真正要实现这一点非常困难,所谓隔行如隔山,对于不同人而言,这里面不知道隔了多少座山。
数据分析师的学习框架
这里我从工具、理论、思维和表达四个层面进行总结。
- - 数据分析师需要掌握的工具:
数据分析师对于工具的学习要到什么样的深度?这个问题一直困扰着很多想要转行数据分析的人士。关于这个问题,其实我在前面已经有所指代,数据分析师不应当过于工具化,工具化的思维方式不利于数据分析师的发展,所以工具的学习深度以满足业务问题的解决为目标即可。
就业务数据分析师而言,Excel、PowerBI、MySql、Spss等是必须掌握的工具。
就算法工程师而言,除了上述工具外还需要掌握Python、TensorFlow等机器学习工具。
就大数据分析师而言,除了上述工具外还需要掌握Hadoop、Spark等海量数据处理工具。
2. 数据分析师需要掌握的理论基础:
**统计分析理论:**对于数据分析师而言是必不可少的。统计分析理论讲的是如何在不确定性中找到规律和模式。事实上很多企业会做市场调查,对调查数据的解读,往往就需要用到统计分析的方法。此外,对于模型有效性的解读、对数分析过程中阈值设定的有效性等,都与统计分析密切相关。也正是由于存在各种不确定性,才有数据分析师存在的价值。
**模型算法理论:**模型算法是个非常深的领域,不仅仅是大众理解的数学公式那么简单,其中涵盖了数据清洗、探索性分析、特征工程、降维、模型参数标定、模型评价等理论知识,也是数据分析师走向“神坛”必须越过的一道砍。
**可视化理论:**可视化并不是简单做几张图表完事了,之所以可以成为一门理论,是因为其中有一些基本的原理可以遵循,包括视觉理论、配色理论等等。
- 数据分析师需要具备的思维能力:
数据分析师这个职业具有交叉学科的特点,既要有工具能力,又要有很强的思维能力。这里的思维能力可以从两个层面进行理解,我称之为道和术。还是举例说明,对于同一个数据不同数据分析师的解读往往并不一致,比如这次疫情温州市确诊420例,有些人说很高,有些人说不高,说高的人全部是浙江人,说不高的全部是湖北的,都没错,但是站的角度不一样,结论就不一样。因此道的层面,数据分析的很多原则是需要把握好的,这里面有尺度的原则、有不带偏见的原则等等。当然原则仅仅是一方面,其中还包括基本的价值观和社会观等等。术的层面,说的是业务思维能力,对于业务方面的问题,并不存在最优的数据分析方法,只存在适合的方法,这点也是在学习过程需要不断体会并加之理解的。
- 数据分析师需要具备的表达能力:
**与其他部门或领导沟通:**切忌以数说数,数字本身并没有实际意义。如果数据分析师把这次疫情的死亡病例仅仅看作是数字进行解读和分析就毫无意义。数据分析师需要解读的还有这些数据背后的家庭和故事,这些才是真正能够赋予数字生命力的元素。与其他部门和领导沟通的过程中也是一样,务必以容易理解的佐证来切中数据分析结论的要点。
**报告的撰写:**对于实际工作而言,数据分析师需要具备撰写报告的能力和制作ppt进行汇报的能力,两者有非常大的区别。报告详细详细,表述务必客观;ppt需要突出重点,并解读数字背后的主要意义,呈现的时候可以生动活泼。
哪些人适合学习数据分析:
数据分析师对于性别的歧视远远低于程序员,因此算是比较公平的行业。但是对于入门还是有一定的要求的,首先专科以下学历的群体基本不需要考虑了,其次专科学历最好是相关专业出身,最后当然是兴趣了,数据分析的工作经验告我,这个世上并不存在所谓的绝对道理。
欢迎加入QQ群学习交流:643459329