独家编译 | 大数据的未来:10个专家看2018
来源:churchillfrank.com 原作者:Carly Yuk
友萌君碎碎念:每年的12月都交织着怀旧和憧憬,也弥漫着过年的前奏气息。这篇未来系列,希望能激起你对2018的憧憬,大数据越来越好了,我们也是~
本文约3千字 | 速读3分钟
在即将到来的2018年,大数据将怎样帮助企业发展创新业务,开发更多的消费者?大数据从业人员又有什么样的行业机会,这里邀请了10个大数据专家来分享他们的看法。
【1】LillianPireson,数据科学家。创立了Data-Mania数据科学咨询公司,提供数据科学技术和工具的咨询和培训服务:
在西方发达国家,“大数据”作为科技热词已经被其他热词如AI、IoT、Deeplearning等取代,但这些新词所代表的概念,实际是大数据行业深化发展的结果。而在发达国家之外的世界,如中东和亚洲(编者注:应不包括中国),现代数据技术和应用的发展要慢得多,冲击刚刚开始。
Lillian的咨询服务对象是企业高管和技术人员,她从这个业务中获得了巨大的回报。而参加培训的人,无论国家、身份、性别或宗教背景,一旦学习和掌握了数据科学或数据工程技术知识,都能在最好的企业里找到相应的岗位,有机会参与重要项目,获得高薪回报。没有行业比大数据及相关领域更令人兴奋。
【2】GregoryPiatetsky-shapiro博士,大数据专业媒体KDnuggets.com总裁,KDD(知识发现和数据挖掘大会)的联合创始人,ACM SIGKDD(数据挖掘和数据科学专家联合会)前主席:
几年以前,没有人相信计算机会做到AlphaGo Zero所做的,但DeepMind做了到,在此基础上,2018年,Deepmind还会有新的成果,让我们拭目以待。同时,无人汽车(和卡车)也将取得更多进展,第一时间问题(类似去年洛杉矶自驾班车那样因不能错车而发生撞车事故)也能解决,以确保自驾车能在本地即时处理路况。2018年AI热度会继续增高,但速度会慢下来。
【3】Kirk Borne博士,BooZ Allen Hamilton的首席数据科学家,10大数据科学和大数据意见领袖之一:
大数据热已经持续几年了,市场上围绕大数据宣传推广的各种概念中,最重要的一个”V“必须是”价值“这一V,2018年大数据行业将在用大数据解决实际问题上有所突破,这关系到如何创造和创新所有数据信息资产的价值,投资者也希望和需要大家围绕大数据的投资回报率来讨论、展示并证明数据的价值。
【4】RonaldVan Loon,数字营销广告总监,数据科学、IoT&AI领域10大意见领袖之一:
数量巨大的联网设备所产生的海量数据很难分析,而边缘分析【Edge Analytics】技术将解决这一问题。到2020年,世界范围内的联网设备将到达300亿台,这将推动边缘分析技术的应用继续增长。所谓边缘分析,即在联网设备终端上进行实时数据分析,数据在哪里产生就在哪里进行分析,所有的联网设备,网关、传感器或其他联结设备都能实现边缘分析,从而帮助企业处理集中式分析所不能应对的联网设备海量数据分析问题,同时也能够利用这种流数据处理模式,解决中央数据平台固有的分析延迟、投入过大、网络慢等问题。边缘分析这一高效的数据分析模式可应用到所有行业。更快的决策和反馈能力,将更有效的帮助企业的业务成长。
【5】Lisa-ChristinaWinter, GateB的数字营销和数据科学专家,擅长利用各种统计软件工具和技术来制定评估方法和测试设计进行统计实证研究:
几年前,企业级数据分析还是”可以有“,今天已经是”必须有“,数据分析成为企业经营中保持竞争力的标配,这种认知在2017年已经形成,2018年会更加深化,将有更多的令人叫绝的工具和成果出现,大数据应用将取得长足进步。
【6】BenRogojan,多年从事医疗健康数据应用,在开发防欺诈算法、重构医保政策以降低总体医保成本的数据应用上有丰富经验,同时也是营销和IT运营优化专家:
2018是大数据应用落地年,许多在2016、17年就已经开始的大数据和数据科学项目,2018年将能结出成果。2017年,咨询公司博思爱伦[Booz Allen]和卜古[Kaggle]大数据竞赛平台联合发起了一个大数据竞赛项目,该项目要求参与者利用CT扫描数据来减少肺癌的误诊率。现在,项目获胜者们已经开始将竞赛成果转化成应用解决方案,用来大幅度减少医生看片时间。这些项目肯定会受到成本日渐高企的医疗机构的欢迎。可以预期,2018年,随着数字化医疗图像数据采集量不断增大,数据科学家能够获得更多的数据、分析洞察更多的问题,从而提高医生的诊断效率。而且,把最近几年收集的海量数据与流分析[StreamingAnalysis]技术所取得的成果结合起来,则可以实现实时洞察,这不仅能应用于医疗健康行业,还能用在很多其他领域,如自驱动的送货无人机、智能穿戴设备等。
【7】DavidTalby, Pacific AI的CTO,擅长医疗大数据和数据科学应用:
大量研究表明,AI在临床诊断、病危预测、治疗方案选择和诊断成像等方面的表现优于人类专家。这些研究成果将很快进入临床验证阶段,在实时监控或类似项目上也会出现融资顺利的初创企业,虽然一开始规模不大,还不能立即改变病人和医生的行为模式,但这些尝试却为行业提供了一个非常好的学习机会。
此外,大型医疗诊断系统在核心数据整合、病人360度扫描成像、经典BI分析及报表工具等大数据处理及应用上,面临如何规模化运营的挑战。由于越来越多的系统在收集和存储病患数据,这些系统将开始迎接下一步的挑战:创建通用数据模型,基于可交换的电子病历打造一个数据科学平台,以整合更多的数据驱动的医疗系统。许多关键性的大数据技术,如云计算、数据湖、机器学习等等在其他垂直领域应用已趋成熟,现在已经加快了引入医疗行业的步伐。而更多新技术,如增强学习和流数据分析,只有在其他行业解决了规范性、安全性、稳定性和支持模式的前提下才会用于医疗领域。
【8】DanielYarmoluk,ATEKAccess Technologie公司的IoT分析和战略发展部总监,“AllThings Data”节目主播,VertiAI.com撰稿人:
大数据是一种大型的、精细的、基于复杂环境的多语言编排服务。要想真的解决速度甚至高速问题,就必须重视大数据查询流程,需要用适当的元数据管理工具来提取数据价值。这意味着要用编排工具简化所需的复杂数据集管理流程,从而通过模版化BI分析任务来实现响应速度的提升。
Amazon、Facebook、Google and Apple等公司已经是大数据应用的胜出者,希望在市场上还能出现其他企业,将数据和有价值的战略资产充分结合创造新的商业模式。
【9】EduardoSiman, VRARA(VR&AR协会)迈阿密分会的联合主席,天使投资人、Virtualitics的顾问委员会成员、VR/AR、数据可视化、区块链、机器学习、大数据、物联网和火星探险等新技术的积极推动者,未来派IT领袖:
随着电子商务(E-commerce)迁移到虚拟商务(V-commerce),消费者和虚拟商品的互动会有越来越好的体验,从而会产生数据大爆炸,让品牌商和制造商获得前所未有的丰富数据。因此,未来大数据分析将聚焦在由虚拟和增强现实体验产生的3D数据。
应对3D消费者分析数据大潮,需要建成可处理图像密集型任务的大数据系统,比如计算机视觉系统。目前的主流大数据加工处理技术Hadoop和Spark集群将会被GPU密集型服务器集群取代,后者能处理3D制图中与特定顶点相关联的消费者洞察数据。比如,一个消费者在自己的房子里用iOS11摆放一件增强现实家具,那么房间里地板和墙的所有数据都会用来分析这件家具售出的可能性。进一步,还可以分析该消费者家里还有哪个空间可以放另一件家具。品牌商或零售商需要这样的具有推荐功能的大数据机器学习系统。
尽管现有的技术还不能实现这种3D版推荐系统,但GPU的加速普及和机器学习的快速演化,将使3D数据分析比预期更快地实现。
【10】MarcusBorba,全球有影响力的大数据意见领袖,数据科学解决方案咨询机构Borba的创始人:
当下复杂的商业环境中,企业一方面产生越来越多的数据,另一方面持续关注如何从数据中获得有价值的决策参考信息。数据不仅是公司的主要资产,更是企业经营成功的驱动器。
大数据概念热已经被AI取代,虽然有不少泡沫成分,但AI是实实在在存在,并且会是来年技术发展的主要驱动力。目前与AI相关的主要是安全、隐私和道德问题,这三个问题将会作为一个整体引起全社会的广泛讨论。最近几年,机器学习取得了巨大进展,机器学习能力被整合进各种类型的软件和平台中,让各行业从业人员可以知其然而不知其所以然地利用机器学习技术尝试解决各种专业问题。而大数据、云计算、机器学习和IoT的融合,则为自助分析【Self-service analysis】的兴起提供了新的机会。更多企业将采用云端分析模式,IoT平台也会提供越来越强大的机器学习能力,让用户分析传感器数据,发现相关性,进而制定响应策略。
小互动:对于大数据的未来,你的感想如何?国外专家和国内专家的角度有不同吗?