2020-10-27

大数据理解

大数据. 一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
大数据的本质就是一大堆结构化的和非结构化的数据。因为数据量太大,你没办法使用,你需要从中抓取出有价值的内容或你想要的数据,这就是大数据应用。
大数据有五大特点,即量(Volume)、速度(Velocity)、多样(Variety)、价值(Value)、***真实性(Veracity)***。

以下内容为初学者理解

比如:

  1. 当下特别火的快手、抖音等短视频软件会根据你的喜好来推荐你喜欢的视频
  2. 浏览器、淘宝、京东等软件会根据你的需求进行筛选提供你的需要
  3. 对天气分析进行预报 根据交通情况制作合适路线等等

2020-10-27

自我认知:
处理 有点像统计学只不过多了使用计算机等方面的知识
获取 类似于网络爬虫 利用网络爬虫获取网站的信息对网络数据的抓取和处理(可以利用Python制作网络爬虫 Python简洁方便)以此进行数据整理

推荐网址:https://blog.csdn.net/kailzhu/article/details/106895450