对云计算,大数据和人工智能的浅谈(二)

      在第一部分中我们了解了云计算的基本知识,知道为什么要云计算,是为了让闲置的资源更好的被利用。我们需要云计算来帮助我们处理的是什么呢?基本的算数?还是少量的数据呢?都不是的。应该是我们下面要讲的内容。

     第二部分:大数据

      什么是大数据呢?“大”,在中文里面的解释是超过通常的情况或者是特定的对象。大数据,就是指没有办法在一定的时间范围内用一些常规的软件工具进行管理和处理的数据集合,需要新的处理模式才能有更强的决策力,洞察力和流程优化能力的海量,高增长率和多样化的信息资产。
      数据的分类:结构化数据和非结构化数据。结构化数据是指有固定的格式或者长度的数据,例如数据库等;非结构化数据值得是不定长或者没有固定格式的数据,比如word文档等。当然,我们还有第三种分类:半结构化数据。第三种分类是按照实际的需要可以按结构化处理,也可以抽取文本进行非结构化处理,例如XML,HTML等。

      大数据的收集分为三大方式:一,软件厂商提供数据接口,实现数据的采集汇聚,这个过程需要多方的工程师到场,了解所有系统的业务,经过推敲,才能确定可行的方案,这样做的缺点就是开发的性价比较低;二,开放数据库方式,这是最直接的一种方式,如果两个数据库在一个服务器上,只要用户的设置不存在问题,就可以通过简单的SELECT * FROM 语句实现;如果在不同的服务器上,一般建议采用链接服务器的形式处理,不同的服务器设置一般都是不一样的,要重新设置比较麻烦,缺点就是很多的厂商出于安全性的考虑,一般不会开放自己的数据库;三,基于底层数据交换的数据直接采集方式,通过获取软件系统的底层数据交换的网络流量包,基于底层IO请求和网络分析的技术,把收集到的数据转换成新的数据库,并放到新的数据库;这一种方式克服了前面两种技术的缺点,并且更加的高效,是当今主要的收集方式。

                                    对云计算,大数据和人工智能的浅谈(二)  

       当有了大量的数据,我们讲其存储起来,对我们来说,这就是一笔财富,当然不能丢掉,需要找一个很大的存储空间将它存储起来。然后进行数据的分析,收集的数据里面肯定有很多的垃圾数据,显然我们并不需要这些,对数据进行筛选,保留有用的数据。再给这些数据进行分类打上标签,当我们想要的时候,通过搜索引擎就能找到这些数据。

      大家有没有发现,当我们在某宝上面看某种商品的时候,打开某头条,在上面也能看到某宝的推荐商品信息,点进去,就是某宝。在这后面就是大数据的默默支持和工作,它将你在某宝上面的浏览的记录进行收集,整理,做成索引,给到某头条,然后就会出现相应的商品信息。当然,还会有人遇到过被某软件“大数据杀熟”的情况。

                                对云计算,大数据和人工智能的浅谈(二)

      当代下的大数据越来越火,它产生各种发展趋势,下面小编为大家展示几种主要的趋势:

      趋势一:数据资源化

      何为资源化呢,就是纸各个企业和社会将大数据看作重要的战略资源,成为大家争抢的焦点,因而在大数据这方面要制定一定的大数据营销战略计划,抢占市场的先机。

      趋势二:与云计算的深度结合

      云计算的弹性,注定要与大数据相结合的。云为大数据提供平台,使之能更好更快,更安全的处理数据。预计在未来,这两者的关系会越来越紧密。除此之外,移动互联网的发展也将会助大数据更快的发展,将会出现一场新的革命。

       趋势三:数据泄露严重(数据炸弹)

       在近几年,我们经常会看到数据泄露的新闻,它与开源有着很大程度上的差别。最近发生的FaceBook的“泄露门”就是很典型的例子。一个实验室的数据被泄露,就有可能意味这为之工作者的辛苦就白白的不见了,意味着这些人白忙活了大半辈子。所以,在未来,我们希望看到更多的加密算法的出现,从源头制止数据泄露的问题。

       趋势四:数据的质量很关键

       很多的低质量的数据,会出现在我们的面前,这是不利于大数据企业的发展的。只有了解了原始数据和数据分析之间的差距,从而才能消除低质量的数据,从而获得BI(商业智能)的最佳决策。

对云计算,大数据和人工智能的浅谈(二)

       大数据使得我们能够社会更加的人性化,我们的选择更加的准确。但是大数据的安全问题不容忽视,我们需要深入讨论如何在一个越来越透明的世界里面去平衡隐私,保障和安全的关系,不要让数据炸弹成为一个隐患。