过滤在熊猫数据帧

问题描述:

我被导演分组烂番茄评分与以下:过滤在熊猫数据帧

director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False) 

print director_counts ---> 

Director 
Woody Allen    44 
Alfred Hitchcock  38 
Clint Eastwood   32 
Martin Scorsese   29 
Steven Spielberg  29 
Sidney Lumet   25 
... 

问: 什么是对我来说,董事超过2部电影过滤的最佳方式?

对于每位导演的平均电影进行过滤会工作吗? bigbadpanda.groupby(["Director"]).size().mean()

+0

你能在这里发布源数据?对于你正在做的事情可能有一个更优化的方法。 – Manhattan

+0

我刚刚检查了'过滤'下的文档。试试这个:'director_counts.groupby(director_counts [“Director”])。filter(lambda:x:x> 2)'用于过滤> 2部电影。我会在一秒钟内补充一点 –

数据我根据你的信息

Director,Movies 
Woody Allen,44 
Alfred Hitchcock,38 
Clint Eastwood,32 
Someone,2 
Someone else,1 

只要做到这一点创建:

df = pd.read_csv('data.txt') 

print(df[df.Movies > 2]) 

输出:

  Director Movies 
0  Woody Allen  44 
1 Alfred Hitchcock  38 
2 Clint Eastwood  32