Python数据可视化--生成随机漫步数据
一、前言
初次接触Python3的数据图表操作,其实和MATLAB语法很相似,所以有一丝似曾相识的感觉。本篇主要是使用Python的matplotlib库来绘制随机漫步图。
二、程序设计
① 要绘制随机漫步图,首先的有数据,所以我们使用random模块在random_walk.py中生成所需数据,具体代码如下:
# random_walk.py
from random import choice
class RandomWalk():
"""一个生产随机漫步数据的类"""
def __init__(self, num_points=5000):
"""初始化随机漫步数组的属性"""
self.num_points = num_points
self.x_values = [0]
self.y_values = [0]
def fill_walk(self):
"""计算随机漫步包含的所有点"""
# 不断漫步,直到列表达到指定的长度
while len(self.x_values) < self.num_points:
# 决定前进方向以及沿这个方向前进的距离
x_direction = choice([2, -2])
x_distance = choice([0, 1, 2, 3, 4])
x_step = x_direction*x_distance
y_direction = choice([2, -2])
y_distance = choice([0, 1, 2, 3, 4])
y_step = y_direction * y_distance
# 拒绝原地踏步
if x_step == 0 and y_step == 0:
continue
# 计算下一个点的x和y值
next_x = self.x_values[-1] + x_step
next_y = self.y_values[-1] + y_step
self.x_values.append(next_x)
self.y_values.append(next_y)
② 第二步就是使数据可视化,调用pyplot绘制图形。具体代码如下,在注释中有函数用法解释:
# rw_visual.py
import matplotlib.pyplot as plt
from random_walk import RandomWalk
while True:
rw = RandomWalk(50000)
rw.fill_walk()
# 设置绘图窗口的尺寸
plt.figure(dpi=128, figsize=(10, 6))
point_numbers = list(range(rw.num_points))
# rw.x_values表示x轴数据, rw.y_values表示y轴数据, c=point_numbers表示绘制的点的颜色, cmap=plt.cm.Blues表示颜色映射,表示 s表示绘制点的大小
plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues, s=1)
# 重点突出起点,edgecolors表示点的轮廓颜色,none表示去除轮廓颜色,在matplotlib 2.0.0版本中edgecolors默认为none
plt.scatter(0, 0, c='green', edgecolors='none', s=100)
# 重点突出终点
plt.scatter(rw.x_values[-1], rw.y_values[-1], c='red', s=100)
# 去除x轴和y轴
plt.axes().get_xaxis().set_visible(False)
plt.axes().get_yaxis().set_visible(False)
plt.show()
keep_running = input("Make another walk? (y/n)")
if keep_running == 'n':
break
我介绍一下scatter中的颜色映射(colormap),颜色映射是一些列颜色,它从起始颜色渐变到结束颜色。
plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues, s=1)
这里将参数c设置为一个y值列表,并用参数cmap告诉pyplot使用蓝色来映射,y值较小则颜色浅,反之则颜色深。