pandas中diff的基本用法和高级用法

首先你要明白diff这个函数的作用,它是用来求差值的,即再df中后一项减前一项的差,记录在后一项的位置上,或者右边减左边的差,记录在左边的位置上,下面具体以两个方面来演示一下。
一、基本用法
pandas中diff的基本用法和高级用法
pandas中diff的基本用法和高级用法
二、高阶用法
很多人可能都知道上面的简单用法,但是在具体的项目中,其实并不是后面减前面,或者右边减左边这么简单。下面是我在项目中用到的,根据不同的指标进行分组求同一指标之间的差值,不同指标的不会计算。
pandas中diff的基本用法和高级用法
首先取出数据后我先根据指标做了一个排序,这个排序是非常重要的,很多时候顺序乱了,你算出来的值也就错了。紧接着用排序后的数据做一个分组,然后求同一组之间【index_value】的差值,赋值给【income】。最后一步是一个填充,因为每个分组都有第一个数是nan,根据你的需要填充nan值,我这里用的是向左填充index_value
的值。后面再细说一下fillna的一些参数。