pandas.qcut()
查阅pandas文档,找到对应的说明pandas.qcut()文档解析:
该函数使用分位数对数据进行划分(分箱: bining),可以得到大小基本相等的箱子(bin),以区间形式表示。
比如示例中:
range(5) : (0, 1, 2, 3, 4), 将其四等分成四个箱子,分别为(-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]; 然后将给定的数字序列用对应的分箱范围替换,0用(-0.001, 1.0]替换,1用(-0.001, 1.0]替换,2用(1.0, 2.0]替换,3用 (2.0, 3.0]替换,4用(3.0, 4.0]替换。
所以原序列(0, 1, 2, 3, 4)就变成了:
[(-0.001, 1.0], (-0.001, 1.0], (1.0, 2.0], (2.0, 3.0], (3.0, 4.0]],也就是函数返回值
同理,下面的示例也是这样,读者自己验证:
关于qcut()的其他用法,等以后碰到再更新。