R:获得ddply中子集的长度

问题描述:

所以我有一个数据集,其中包含以下列:test_group,person_id,gross,purchases。这本质上是人的名单,他们已经花了多少钱,他们有多少次购买了,他们是在什么组R:获得ddply中子集的长度

我用下面的代码ddply得到一些汇总统计:

mean_rpu <- ddply(data, .(test_group), summarise, total_rpu=sum(gross), 
    total_users=length(person_id), total_purchasers=length(subset(data, 
    purchases > 0)$person_id), mean_rpu=mean(gross), sd_rpu=sd(gross)) 

我遇到的问题是“total_purchasers”摘要。我试图计算每个test_group内购买者的数量。当前代码仅在整个数据集中显示total_purchasers,而不是代表test_group因子。我可以用这个做什么优化?

我很感激帮助!

没有一个重复的例子,它很难肯定地说,但也许你想这样的:

total_purchasers=length(person_id[purchases>0]) 
+0

真棒!这正是我所需要的。非常感谢! – user1062293

+1

@ user1062293你需要接受答案,如果它适合你 –

+0

v有用的tx为+ 1 – pssguy