过滤在熊猫数据帧

问题描述：

我被导演分组烂番茄评分与以下：过滤在熊猫数据帧

director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False) 

print director_counts ---> 

Director 
Woody Allen    44 
Alfred Hitchcock  38 
Clint Eastwood   32 
Martin Scorsese   29 
Steven Spielberg  29 
Sidney Lumet   25 
...

问：什么是对我来说，董事超过2部电影过滤的最佳方式？

对于每位导演的平均电影进行过滤会工作吗？ bigbadpanda.groupby(["Director"]).size().mean()）

你能在这里发布源数据？对于你正在做的事情可能有一个更优化的方法。 – Manhattan

我刚刚检查了'过滤'下的文档。试试这个：'director_counts.groupby（director_counts [“Director”]）。filter（lambda：x：x> 2）'用于过滤> 2部电影。我会在一秒钟内补充一点 –

答

数据我根据你的信息

Director,Movies 
Woody Allen,44 
Alfred Hitchcock,38 
Clint Eastwood,32 
Someone,2 
Someone else,1

只要做到这一点创建：

df = pd.read_csv('data.txt') 

print(df[df.Movies > 2])

输出：

  Director Movies 
0  Woody Allen  44 
1 Alfred Hitchcock  38 
2 Clint Eastwood  32

过滤在熊猫数据帧

相关推荐