tableau数据可视化实战:大众点评成都美食(三)
本篇将从价格角度来分析爬取到的5w家店铺。由于价格是连续变量,所以我们先对价格进行分组操作,此例中我们将价格进行如下分组:价格小于等于20元、20-50元、50-100元、100-200元、200-300元以及300元以上。
可以看出,在所有价格段中,50~100元的餐馆数量最多,达到了6730家;20-50元价格段的餐馆数量也很多,将近6k家;此外均价不超过20元的餐馆也突破了5k家。100-200元价格段的有1400家;200-300元价格段以及超过300元的餐馆数都比较少,只有100多家。
接下来我们看看各价格阶段都是哪些类型的餐馆是‘主力军’:
可以看到,在≤20元价格段中,饮品店和小吃快餐占据了绝对数量优势,数值几乎是位列第三的面包甜点的3倍。
20-50元价格阶段,小吃快餐的数量也是最多的,突破了1k家;此外川菜、火锅、烧烤烤串的数量也猛增。
500-100元价格段火锅和川菜占据了主要优势,都超过了1k家,火锅将近2k家。
100-200元价格段仍是火锅和川菜最多,但是数量优势明显没有50-100元价格阶段大。
200-300元价格段,川菜终于超过了火锅,位列第一,其数值是火锅数量的3倍多。这说明,相比于川菜,火锅更为平民化一点,虽然两者都能做高端,但是在高端市场上,川菜的数量明显高于火锅的数量。
在>300元价格阶段,川菜数量仍然位列第一,而火锅的排名已经跌出前5,位列第6,数量还未超过10家,这也印证了上面的分析;此外日本菜、西餐、私房菜、海鲜第一次上榜,并且排名不低,说明这几种菜品大部分走高端路线。
接下来我们看看各价格段餐馆的平均评论数:
可以看出,100-200元价格段餐馆的平均评论数是最多的,平均每家有840条评论;接下来是较高消费的200-300元价格段和>300元价格段,平均评论数都超过了600条;平均评论数最少的是≤20元价格段和20-50元价格段,评论数都没超过200条,≤20元价格段的评论数甚至未超过150条。评论数差距较大的原因可能在于相比于中高消费和高消费,选择较低价格段餐馆的食客大部分吃完就走,不太会在用餐结束后留下评论;而选择较高价格段餐馆的食客很多会在用餐结束后留下评论,可能是另一种程度上的‘打卡留念’。
接下来我们看看各价格段的评分情况:
从上图可以看出,除了在口味上,100-200元的评分略微超过了200-300元的评分,其他的评分都是随价格上升而上升,这也在一定程度上印证了‘一分价格一分货’这句话。此外,从分数数值来看,这4张图都有一个明显的分组:≤20元和20-50元是一个组,分数基本在3.8-3.9左右,这组可以看成低消费组;50-100元单独一个组,分数基本在4.0-4.1左右,这组可以看成中消费组;100-200元、200-300是一个组,分数基本在4.2-4.3附近,这组可以看成中高消费组;>300元是一个组,分数在4.4-4.5左右,这组属于高消费组;随着消费的升级,评分也随着上涨。从分数极差来看,总体评分的极差是0.58、口味评分的极差是0.54、服务评分的极差是0.65、环境评分的极差是0.74,因此,相比于口味,高消费餐馆更多地是靠更为优质的服务和更好的就餐环境来吸引顾客。