数据可视化-写在开篇之前

信息千万条,版权第一条:本文章所用图片均为开源语言python编译后经PyCharm Community版生成,使用请注明出处。
开篇第一句,先上一只小乌龟敬雍正帝,保佑在python编译中bug越来越少(据说雍正专治Bug)。
数据可视化-写在开篇之前数据可视化-写在开篇之前
第二句,先欣赏下本文的主题,惊艳的上帝的指纹:曼德勃罗集合,数学公式表示为Zn+1=(Zn)^2+C(公式能不能理解不重要,图重要)。这也是数据可视化领域最有代表性的图表(没有之一)。
下述图均为上面两图的细节放大(看图就行,动手是没用的,因为我在输出图像时设置了分辨率,放大就模糊了)。
在性能很高的计算机,细节可以无限放大,精彩也各不相同。我的电脑性能太渣,大概看下就行了。
数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前数据可视化-写在开篇之前

第三句,说说为什么我们需要数据。
此公众号主要展示从公开渠道收集来的数据,并使用编程语言将其可视化,即你给我一堆数据,我给你一张图。所以,我的工作是,开局一张图,内容全靠编。
下面这组图展示了信息可视化的过程,也说明了信息为什么要经过可视化处理。
1, 原始数据,此组数据共有1000个,由1-100之间的数字生成的伪随机数。
数据可视化-写在开篇之前

看着图,会不会觉得很崩溃,全无头绪规律可言。
2, 经过简单的处理,我们去除重复的数字,并生成一个圆圈图。
数据可视化-写在开篇之前

现在看起来清爽多了吧。请接着往下看。
3, 我们对圆圈图中被3除后,余数为0,1,2的数字分别标示为绿色,红色和蓝色(因为颜色经过透明化处理,所以跟我们看起来的颜色有一定差异)。
数据可视化-写在开篇之前

现在看起来有一些层次感了。不同阵营的小朋友挤在不同的地方,也有一些被孤立开来。
4, 如果想知道在这1000个数据中,每个数字出现的频率呢?将数字按照出现的频率排序,出现多的画一个大圈圈,少的画小圈圈。

数据可视化-写在开篇之前
5, 对出现最多和最少的数字标示为黄色。
数据可视化-写在开篇之前

36出现了22次,而100只出现了一次。
6, 如果想知道能被10整除的数分布在哪里呢?请看图。

数据可视化-写在开篇之前
能被10整除的数分布得好没规律~~~
7, 将数字出现的频率按照高低,从中央向外围排列。为了美感,这次没有使用不同尺寸的圈圈,只在一定范围内使用同一个规格的圈圈。

数据可视化-写在开篇之前
现在看起来,会不会很清晰呢?
在这次伪随机生成的数字中,36,11,56,12,72和31出现的次数偏多一些。
开篇介绍至此结束。