Python数据分析之Matplotlib-III

13 表格样式创建

  • 表格视觉样式:Dataframe.style → 返回pandas.Styler对象的属性,具有格式化和显示Dataframe的有用方法
  • 样式创建:
    1. Styler.applymap:elementwise → 按元素方式处理Dataframe
    2. Styler.apply:column- / row- / table-wise → 按行/列处理Dataframe

13.1 样式

# 查看样式类型
df = pd.DataFrame(np.random.randn(10, 4),columns=['a', 'b', 'c', 'd'])
sty = df.style
print(sty,type(sty))

# 显示样式
sty

Python数据分析之Matplotlib-III

13.2 按元素处理样式:style.applymap()

# 创建样式方法,使得小于0的数变成红色
# style.applymap() → 自动调用其中的函数

def color_neg_red(val):
    if val < 0:
        color = 'red'
    else:
        color = 'black'
    return('color:%s' % color)
df.style.applymap(color_neg_red)

Python数据分析之Matplotlib-III

13.3 按行/列处理样式:style.apply()

# 创建样式方法,每列最大值填充黄色
# axis:0为列,1为行,默认为0
# subset:索引

def highlight_max(s):
    is_max = s == s.max()
    #print(is_max)
    lst = []
    for v in is_max:
        if v:
            lst.append('background-color : yellow')
        else:
            lst.append('')
    return(lst)
df.style.apply(highlight_max, axis = 0, subset = ['b', 'c'])

Python数据分析之Matplotlib-III

13.4 样式索引、切片

# 通过pd.IndexSlice[]调用切片
df.style.apply(highlight_max, axis = 1, 
               subset = pd.IndexSlice[2 : 5, ['b', 'd']])

Python数据分析之Matplotlib-III

14 表格显示控制

  • df.style.format()

14.1 按照百分数显示

df = pd.DataFrame(np.random.randn(10, 4),columns=['a', 'b', 'c', 'd'])
print(df.head())
df.head().style.format("{:.2%}")

Python数据分析之Matplotlib-III

14.2 显示小数点位数

df.head().style.format("{:.4f}")

Python数据分析之Matplotlib-III

14.3 显示正负号

df.head().style.format("{:+.2f}")

Python数据分析之Matplotlib-III

14.4 分列显示

df.head().style.format({'b':"{:.2%}", 'c':"{:+.3f}", 'd':"{:.3f}"})

Python数据分析之Matplotlib-III

15 表格样式调用

  • Style内置样式调用

15.1 定位空值

df = pd.DataFrame(np.random.rand(5, 4),columns = list('ABCD'))
df['A'][2] = np.nan
df.style.highlight_null(null_color = 'red')

Python数据分析之Matplotlib-III

15.2 色彩映射

df = pd.DataFrame(np.random.rand(10, 4),columns = list('ABCD'))
df.style.background_gradient(cmap = 'Greens', axis =1, low = 0, high = 1)
# cmap:颜色
# axis:映射参考,0为行,1以列

Python数据分析之Matplotlib-III

15.3 条形图

df = pd.DataFrame(np.random.rand(10,4),columns = list('ABCD'))
df.style.bar(subset = ['A', 'B'], color = '#d65f5f', width=100)
# width:最长长度在格子的占比

Python数据分析之Matplotlib-III

15.4 分段式构建样式

df = pd.DataFrame(np.random.rand(10,4),columns = list('ABCD'))
df['A'][[3,2]] = np.nan
df.style.bar(subset=['A', 'B'], color = '#d65f5f', width = 100).\
    highlight_null(null_color = 'yellow')

Python数据分析之Matplotlib-III