R:获得ddply中子集的长度
问题描述:
所以我有一个数据集,其中包含以下列:test_group,person_id,gross,purchases。这本质上是人的名单,他们已经花了多少钱,他们有多少次购买了,他们是在什么组R:获得ddply中子集的长度
我用下面的代码ddply得到一些汇总统计:
mean_rpu <- ddply(data, .(test_group), summarise, total_rpu=sum(gross),
total_users=length(person_id), total_purchasers=length(subset(data,
purchases > 0)$person_id), mean_rpu=mean(gross), sd_rpu=sd(gross))
我遇到的问题是“total_purchasers”摘要。我试图计算每个test_group内购买者的数量。当前代码仅在整个数据集中显示total_purchasers,而不是代表test_group因子。我可以用这个做什么优化?
我很感激帮助!
答
没有一个重复的例子,它很难肯定地说,但也许你想这样的:
total_purchasers=length(person_id[purchases>0])
真棒!这正是我所需要的。非常感谢! – user1062293
@ user1062293你需要接受答案,如果它适合你 –
v有用的tx为+ 1 – pssguy