一个聪明的方式来摆脱Pandas或PieChart的可视化引擎中的微不足道的数据?
问题描述:
可能有很多不重要的边缘情况和数据噪音。我希望得到一个饼图(基于背景虚化或任何其他开源,免费的情节库),将允许看到这样的数据:一个聪明的方式来摆脱Pandas或PieChart的可视化引擎中的微不足道的数据?
type size
S 1
V 2
T 200
...
Z 3333
减少到其核心,有显着性(< 1%类型尺寸)噪音投入新的“其他”类型。
1)大熊猫可以自己做吗?怎么样? 2)是否有一些可视化已经与这种功能集成?
答
考虑大熊猫系列a
与值
import pandas as pd
import numpy as np
from string import ascii_uppercase
np.random.seed([3,1415])
types = np.random.permutation(list(ascii_uppercase))
r = np.arange(1, 27)
r = r/r.sum()
s = np.random.choice(types, 10000, p=r)
a = pd.value_counts(s)
a.plot.pie(colormap='jet');
现在组的所有组与表示小于3%的计数为一组other
n = a/a.sum()
f = n < .03
a[~f].append(pd.Series(a[f].sum(), ['other'])).plot.pie(colormap='jet')