熊猫:选择大于值
问题描述:
我的数据框有一个名为dir
的列,它有几个值,我想知道有多少值通过某个点。例如:熊猫:选择大于值
df['dir'].value_counts().sort_index()
它返回一个Series
0 855
20 881
40 2786
70 3777
90 3964
100 4
110 2115
130 3040
140 1
160 1697
180 1734
190 3
200 618
210 3
220 1451
250 895
270 2167
280 1
290 1643
300 1
310 1894
330 1
340 965
350 1
Name: dir, dtype: int64
在这里,我想知道通过500在这种情况下,值的数量,这一切都只是100,140,190210,280300330350。
我该怎么做?
我可以逃脱df['dir'].value_counts()[df['dir'].value_counts() > 500]
答
(df['dir'].value_counts() > 500).sum()
这得到了价值数和返回他们为一系列真值。这些parens把这件事看作一系列的东西。 .sum()
将True值计为1,将False值计为0.