过滤在熊猫数据帧
问题描述:
我被导演分组烂番茄评分与以下:过滤在熊猫数据帧
director_counts = bigbadpanda.groupby(["Director"]).size().order(ascending = False)
print director_counts --->
Director
Woody Allen 44
Alfred Hitchcock 38
Clint Eastwood 32
Martin Scorsese 29
Steven Spielberg 29
Sidney Lumet 25
...
问: 什么是对我来说,董事超过2部电影过滤的最佳方式?
对于每位导演的平均电影进行过滤会工作吗? bigbadpanda.groupby(["Director"]).size().mean()
)
答
数据我根据你的信息
Director,Movies
Woody Allen,44
Alfred Hitchcock,38
Clint Eastwood,32
Someone,2
Someone else,1
只要做到这一点创建:
df = pd.read_csv('data.txt')
print(df[df.Movies > 2])
输出:
Director Movies
0 Woody Allen 44
1 Alfred Hitchcock 38
2 Clint Eastwood 32
你能在这里发布源数据?对于你正在做的事情可能有一个更优化的方法。 – Manhattan
我刚刚检查了'过滤'下的文档。试试这个:'director_counts.groupby(director_counts [“Director”])。filter(lambda:x:x> 2)'用于过滤> 2部电影。我会在一秒钟内补充一点 –