数据中台是什么

导读

现在,“数据中台”这个概念越来越火,但是数据中台到底是什么,服务对象是谁,目标又是什么?

数据中台的概念

数据中台被誉为大数据的下一站,由阿里兴起,核心思想是数据共享,并在 2018 年因为“腾讯数据中台论”再度成为了人们谈论的焦点。

——CSDN:VIP_CQCRE:【到底什么是数据中台?

数据中台是对既有/新建信息化系统业务与数据的沉淀,是实现数据赋能新业务、新应用的中间、支撑性平台。

——百度百科【数据中台

确实,数据中台只是近些年火起来的名词。而且“数据中台”这个词语,听起来就像是和“数据”和“”有很大的关系,似乎就是中间件+大数据。虽然目前还没有一个定义来确定这个词语到底是指代什么,但是很明显的是,这个词语就是为了数据中间处理而存在的。

既然这个技术涉及数据,那么这个技术将不可能外包给其他的什么公司或者个人。虽然非常无奈,但是物理隔绝确实能保证秘密不会被传播。所以,比起SpringCloudOdooGoodERP等这些个框架,还是不能够随意售卖、转让或者开源。

那么数据中台到底是什么?

数据中台是一套可持续“让企业的数据用起来”的机制,一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建一套持续不断把数据变成资产并服务于业务的机制。

——知乎:Alan:【数据中台(一)什么是数据中台

数据中台是在政企数字化转型过程中,对各业务单元业务与数据的沉淀,构建包括数据技术、数据治理、数据运营等数据建设、管理、使用体系,实现数据赋能。数据中台,是新型信息化应用框架体系中的核心。

——百度百科【数据中台

中台是一种经营理念;中台是一种组织形式;中台是“平台思维”的自然演进

——节选自第十届全球软件开发大会:菜鸟数据中台的演讲

看起来还是有点深奥。而且越来越多的专业词汇让你感觉到更摸不着头脑了!

让我们来看看知乎:Alan:【数据中台(一)什么是数据中台】中附上的图片:

数据中台是什么

到这里,基本上就对数据中台有一个概念了:

数据中台实际上是企业在对用户行为进行分析时,为了将用户数据最大化利用的平台。

那么,什么是最大化利用?(注:因为科技能力限制,所以每个时代都有每个特定的最大化限制

举个例子,在很早之前,甚至电商还没有起步的时候,你的小蛋糕店(La Soleil)都是通过你自己的大脑记住常客的偏好来选取顾客最喜欢的口味。

但是,你的猫娘女仆们实在太可爱了,为你吸了大量的粉,生意很快做起来了,不光是为了蛋糕,还有为了猫娘慕名前来的顾客,甚至还有预定的顾客,你越来越忙不过来了。所以,你用你超强的代码能力,做了个推荐系统出来。用户注册之后,系统便会记录每一次下单的偏好特点,并制作适当的模型进行预测。用户再次下单时,就能看到自己的偏好摆在首页上,非常方便。

这时,你的妹妹(这即视感太强烈了啊喂)当起了你的蛋糕店的公关,开始推广、联动,甚至积极出周边,很快做出了蛋糕店以上的很多服务。你的小蛋糕店规模现在已经不得了了,甚至歪果仁都慕名而来,推荐系统的日活甚至超过了10万。于是,你决定将小作坊升级为大企业。这个转变并不容易,所以你想到了数据中台。你希望数据中台为你完成这些任务:

  • 你一个人再也没有那么多精力制作那么多的蛋糕了,所以你雇用了很多特级厨师,不仅要做蛋糕,还要做出法式、意式、英式、中式、日式等等特色;别忘了雇佣采购员和外送员,你们家的猫娘忙着照顾客人,才没有时间出去跑腿呢。数据中台就帮助你完成企业中各角色的上下班打卡、每日食品产出、请假、评级等等的人员管理。这是企业员工管理
  • 你的蛋糕店的各种原材料库存得严格把关了。糖每天都有多少、奶油每天还有多少、各种水果罐头每天还有多少……低于某一个阈值的时候发短信、发邮箱进行预警。这是企业库存管理;
  • 你的蛋糕店的各种用户数据都应当记录,并且针对客户的各种订单进行偏好预测;同时,还要能够接收客户对于各种地方的吐槽,并且积极回复、处理、反馈。这是企业客户管理
  • 为了高效制作蛋糕,机器肯定不能少。搅拌机、烘烤机等等全部都要有一个管理,比如哪个设备正在运作、经过了多长时间的连续运转、下次损坏是多久之后等等;不仅如此,部分简单劳动可以使用机器集群完成,一旦集群中某一个坏掉了便需要紧急绕开损毁机器并选择其他运行方案。这是企业设备管理
  • 在完成基本的用餐之后,你的妹妹还需要处理各种联动企划、手办设计和各大平台的推广,于是需要记录各种各样的合作安排与合作绩效,并从中选出最有前景的几家进行长期合作。这是企业合作管理
  • ……

听起来这完全就像是一个很普通的ERP系统?不不不,远没有这么简单。细心的你应该能注意到这些事情:

  • 人员管理中,你可以使用大数据对现在的员工进行分析,他们是有什么样的特殊属性才能够成为企业中最优秀的几个员工,下次招聘的时候就按照这个标准进行招聘,从而让自己的员工逐年精进;
  • 库存管理中,你可以使用大数据分析前些日子中的售卖数据,然后发现每年的特定时间段有着特定的销售规律,库存也会按照这个规律逐渐耗尽,有时速度非常快,有时速度非常慢。针对不一样的处境,系统会选择不同的时机提出警告,让采购尽快购回;
  • 客户管理中,你可以使用大数据分析客户行为数据,将一个个用户逐渐标签化,使用权重最大的一个或者很多个标签对用户的偏好进行分析和定义,以便能够更好地推销新旧产品;
  • 设备管理中,你可以使用大数据分析机器在什么样的工作环境下工作能够坚持多久,并预测在什么样的环境下这个设备将会被损毁,从而尽快维护翻新更换;同时在机器集群损毁其中一台的时候,你的整个系统能够寻找不影响其他机器运转的其他线路,进行智能调度
  • 合作管理中,你可以使用大数据分析在什么样的平台做推广能够得到最大回报,也可以分析手办穿着什么服装、摆出什么动作能够得到买家最大的呼声,并使用数据可视化做出日活、周活等折线图、柱状图、饼状图等进一步辅助分析;
  • ……

通过ERP和大数据的结合,也就是具有灵魂的业务加上能力超强的工具,就成了。听起来这个普通得不能再普通的ERP系统瞬间就变成了一整个生态,包括了企业员工、企业设备、企业自己、合作企业、蛋糕客户、手办客户等等在内所有的数据整合在一起,通过数据挖掘、数据分析、标签化、智能调度、可视化、监控告警等等技术,完成企业方方面面的管理和经营;作为总经理的你面对每一个问题时都能够从数据中台中找出对应的源数据和经过分析后的数据来进行决策。这听起来就像是世界500强的作风啊

数据中台的目的

看了以上很长一段对于数据中台运行生态和运行机制,我们接下来再讨论数据中台的能力和目的。

数据中台应当具备三个能力:

1、在中台能力及资源充足的情况下(包括业务知识、技术能力、人才积累),提供数据产品、数据服务。

2、在中台业务能力及人力资源不充分、但体系相对成熟的情况下(包括数据体系、技术体系),提供平台级别的能力,包括数据平台能力、技术平台能力、建模平台能力等,甚至是数据本身。

3、在中台人力资源和对业务领域知识理解不充分,平台级别能力也无法满足要求的情况下,作为算力基础平台提供服务。

——知乎:帆软:【一文详解数据中台,别再跟数据平台搞混了!

说白了,这三个目的旨在应对三个不同的场景:

  • 在企业已经做到足够大的情况下,能够为自己的企业、其他的企业提供服务。比如,现在的高德地图提供地图接口、阿里巴巴提供快递查询接口和阿里云服务;
  • 在企业沿用已有的制度和技术的情况下,能够给别人提供服务。比如,现在的GoodERPOdoo进行二次封装之后卖其他的中小型企业,并根据需求进行二次开发和部署;
  • 在企业完全没有形成气候的情况下,给其他企业做最简单的事情。比如,现在的各大高校实验室中,技术力较为低下、硬件水平明显不足、工作时间明显较少,但还是在接很多的横向项目,通过外包和承包等等手段介入并为他们根据原型进行代码实现、根据需求进行数据清洗等等。

简直就像游戏的难度分级一样:从简单到困难,再就是噩梦难度;从不需要太苦思冥想的简单重复劳动,到需要动点脑子针对特殊的业务进行特殊的编码实现,最后到时时刻刻都需要认真思考,针对每一个细节进行最大的优化。如果真的要做到这一步,我们将会更详细地要求:

决策支持类:主题报表(月度/季度/年度/专题)的大屏数据可视化展示

数据分析类BI、商业智能、OLAP分析、数据挖掘、数据驱动的机器学习

数据检索类:全文检索、日志分析、数据血缘分析、数据地图

数据共享开放类:实时数据订阅、离线数据接触、数据API接出

——知乎:帆软:【一文详解数据中台,别再跟数据平台搞混了!

这些就都是只有具有超强算力的大型公司才能够完成的任务了。

不难发现,数据中台甚至都包含一定的业务能力,如果我们放入鸡蛋、面粉和糖(代指源数据),出来的可就是蛋糕(代指最终成果)了;而普通的大数据平台只不过是分析数据的工具而已,如果单纯的放入鸡蛋、面粉和糖,可能就只有一团白色的浆糊(代指半成品中间变量),剩下的烘焙、成型、涂奶油还得我们另外寻找其他办法;再深挖一些,大数据平台中使用的Hadoop集群,就更是完全没有任何其他功能的数学分析工具而已,放入鸡蛋、面粉和糖,它甚至只能在你混在一起之后巧妙地重新分为三类(Hadoop真的是物理意义上毫无感情的机器)。

是不是有点能理解了?