未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

报告作者:马申珅 叶书楠 王天源

未明学院商业数据分析训练营优秀学员

项目报告《支付宝口碑商家评分影响因素》

2017 年,中国餐饮行业年增速达到10.8% 、市场规模 3.96 万亿。并且受当下互联网的影响,消费者选择餐饮的方式已经发生了改变。

在过去,消费者依靠身边人的介绍或者就近选择餐厅,传统的方式一定程度的限制了消费者的选择。如今,各种餐饮相关的app提供大量且详细的餐厅数据。例如支付宝“口碑”作为其中的代表,成立两年半以来目前全国已经有 250 万个商家入驻口碑,日均交易笔数突破3000万笔。由此表明,口碑品牌在以飞快的速度成长成熟,以口碑品牌为例分析数据具有代表性和可信性。

广州作为中国最重要的城市之一,以及作为2017年北上广深中住宿和餐饮业零售额最高的城市,以广州为例子进行分析,也可为其他城市餐厅评分影响因素分析提供思路。

支付宝口碑的餐饮店铺数据可以为我们描绘出一幅怎样的用户画像呢?未明学院商业数据分析训练营马申珅等同学利用所学数据分析技能,完成了《支付宝口碑商家评分影响因素》报告。一起来看下神奇有趣的大数据这次又能给我们带来怎样新奇的发现吧~~

数据来源与说明

源数据说明:

此次报告使用支付宝“口碑”API,对“口碑”广州地区的餐厅进行抓取和数据提取;

原始数据集包含3124条数据以及33个属性;

High-quality Merchant/Popular Area/Parking Info/Group Purchase/Promotion/Advance Reservation/Takeout这7个变量为二元变量,取值为0或1,分别代表无和有。

数据预处理:

原始数据集中包含3124条记录,使用Python软件和Notpad++对原始数据进行预处理;

删除记录重复值8条;

删除BusinessDay取值为0的异常数据3条。

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

数据分析及可视化

01

各菜系数量占比

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

饼图显示数据包括粤菜,西餐,日本料理,川菜和粥粉面五类,其中粤菜餐厅数量的占比最大,符合当地饮食习俗。其余餐厅类型占比排序依次为西餐,日本料理,粥粉面和川菜

02

基于菜系分类统计结果

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

统计结果显示,不同菜系口味得分与等级成正比关系,若餐厅希望被评为更高等级,应重点考虑口味因素。

五大菜系中顾客偏爱西餐,其次为粤菜。

各菜系人均消费结果显示,日本料理最为昂贵,粥粉面价格亲民。

03

广州各区餐厅菜系数量统计

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

将广州按各区分类,天河区中餐厅数量最多,海珠区、越秀区餐厅数量排位靠前。在时间充裕的情况下,消费者更倾向选择在餐厅数量多的区用餐。

04

消费者对各区餐厅评价结果

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

统计结果表明,花都区餐厅平均好评率最高,表明消费者在花都区用餐整体感觉最优;增城区各菜系平均好评率相对集中。

商家若希望进入餐饮行业,可以考虑在花都区设立餐厅,受周围环境影响,更容易获得较高好评率。

05

广州各区餐厅服务和环境平均水平

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

折线图显示不同地区消费者对餐厅服务和环境的满意度调查。各项满分10分,得分最高的地区是萝岗区。

服务质量和环境因素相互独立,评分互不影响。结果显示环境平均得分整体高于服务质量得分,说明商家更多注重餐厅环境风格的设计而忽视了服务。

06

五星等级餐厅附加设施分析

未明学院学员报告:分析了口碑数据后,我发现广州人最爱吃的居然不是粤菜?而美食最多的地区是在……

该组条形图展示所有五星餐厅相关条件,包括是否提供停车信息、是否提供外卖服务、是否处于受欢迎的地区,和是否具有团购优惠。横轴0表示无,1表示有;纵轴表示五星餐厅数量。

结果如下:五星餐厅一共84家,其中提供外卖、位于受欢迎地区、提供团购优惠商家数量均达到半数以上。

四项指标中是否提供停车信息对于餐厅等级评判影响不大。

模型建立分析与营销建议

采用OLS方法建立多元回归模型,根据R^2 、F值、AIC、BIC和t值指标,最终选取了6个解释变量。

在控制其他因素不变时,可以得到以下结论:

1. 当该餐厅为西餐厅时,总评分会增加0.0473分,即顾客对于西餐厅的评分较高,这可能与其优雅环境和精致服务有关。

2. 当顾客对饭店的口味评分增加1分时,整体评分将增加0.47分,说明饭店的口味会显著影响整体评分。

3. 饭店的服务水平、功能多样性和环境也对整体评分有影响。

4. 人均消费对数可解释为人均消费的百分比变化,回归系数为0.0143意味着人均消费降低1%时,总评分就会提高0.0143分。

因此,综合以上情况,我们可以给店铺商家提供的参考性建议有:

1. 菜系:在广州地区开办西餐厅或粤菜餐厅;

2. 地区:在天河区或萝岗区经营更容易获得高分评价;

3. 服务:在注重设计餐厅风格、保证环境舒适度基础上提高服务员服务水平。

4. 附加:为适应餐饮业发展趋势,商家在能力范围内最好提供外卖服务和团购优惠。

以上就是本期分析报告的全部内容。大数据总是能告诉我们一些有趣有用的发现~~

在未明学院,还有更多优秀有意思的作品哦,我们下期“数据揭秘”栏目见~~