(1) 有些时候,可以利用Excel进行简单的数据分析,写数据报表时也会运用到,针对案例,使用Excel的部分功能来实现以下目标。
(2) 现在你有一份的餐食数据,我想通过excel知道以下问题:
1. 全国点评数最高的饭店是哪家?
2. 哪个城市的饭店人均口味最好?
3. 哪个类型的餐饮评价最好?
4. 类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?
5. 口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最
多?
6. 上海地区中,各个类型饭店服务前五名?
7. 没有评价的饭店有几家?
8. 将人均价格划分成0~ 50 , 50~ 100 , 100~ 150 , 150~ 200 , 200+这几个档次,各个城市分别有几家?其中占比又是多少?
9. 将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。
10. 对上海地区的日本料理,做一次描述性分析(开放题)
(3) 数据:
链接: 数据下载
提取码:2ns3
(1)问题一
问题:全国点评数最高的饭店是哪家?
解答:运用INDEX()
和MATCH()
进行数据分析
步骤:
(1) 找出点评数最高的值var
(2) 通过 INDEX()
函数来进行var在“点评”列中的坐标定位,再通过 MATCH()
进行店名中的坐标查找
实现过程
(1) 找出点评数最高的值var
=MAX(D:D)
(2) 找出点评数最高的饭店是哪家?
=INDEX(C:D,MATCH(21180,D:D,0),1)
最后,得到的结果是:
(2)问题二
问题:哪个城市的饭店人均口味最好?
解答:运用数据透视表
进行数据分析
步骤 和 实现过程:
(1)全选表格,点击“插入”,点击“数据透视表”。
(2)创建数据透视表
(3)选择行:城市;选择列:口味;选择 “值字段设置” :平均值
最后,进行数据排序,人均口味最好的城市是上海, 最高约为:7.95
(3)问题三
问题:哪个类型的餐饮评价最好?
解答:运用数据透视表
进行数据分析
针对问题三,同样按照问题二的步骤。
最后,对数据进行排序,餐饮评价最好的类型是火锅, 最高约为:80589
(4)问题四
问题:类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?
解答:运用COUNTIF()
进行数据分析
步骤:
(1) 运用 COUNTIF()
统计每个店名中出现「麻」的字数
(2) 运用 COUNTIF()
统计每个店名中出现「辣」的字数
(3) 控制第一行,点击“数据”,点击“筛选”;将“类别”选成“川菜”;最后,统计「麻」,「辣」列中有多少个带「辣」字,又有多少个带「麻」字
实现过程
(1) 新增一列,运用 COUNTIF()
统计
=COUNTIF(C2,"*麻*")
=COUNTIF(C2,"*辣*")
(3) 统计个数
结果:
统计「麻」个数:28
统计「辣」个数:44
可以大致了解到类型为川菜的店名,同时在「麻」和「辣」两个字做选择,普遍爱好「辣」字。
(5)问题五
问题:口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最
多?
解答:运用“筛选”
进行数据分析
步骤 和 实现过程:
(1)控制第一行,点击“数据”,点击“筛选”;将“口味”,“环境”,“服务”选成8.0以上;
(2)统计饭店的数量,重新复制“城市”,运用数据透视表
统计并描述“城市”的信息。
结果:
统计饭店的数量:457
北京占比最多。
(6)问题六
问题:上海地区中,各个类型饭店服务前五名?
解答:运用IF()
和“筛选”
进行数据分析
步骤 和 实现过程:
(1) 控制第一行,点击“数据”,点击“筛选”;将“城市”选成“上海”;选择“城市”、“类型”、“店名”、“服务”指标后,赋值到新的Sheet中。
(2) 首先对“服务”降序;再对“类型”进行降序(都是扩展到整个区域)。
会发现类型相同的店,它们的服务是降序排列。
(3) 按数字递增来描述“类型”,用到:IF()
函数。
(4) 接下来,筛选第“E”列前五名"<=5"。
最后得到了,各个类型饭店服务前五名。
(7)问题七
问题:没有评价的饭店有几家?
解答:直接对数据进行操作
步骤 和 实现过程:
直接筛选“点评”为空格,再统计类型的总数就是空格的总数,得到没有评价的饭店有1355家。
(8)问题八
问题:将人均价格划分成0~ 50 , 50~ 100 , 100~ 150 , 150~ 200 , 200+这几个档次,各个城市分别有几家?其中占比又是多少?
解答:运用“除”
和“取整”
和"数据透视表"
进行数据分析
步骤 和 实现过程:
(1)运用“除”
和 “取整”
将人均价格分段。
=E2/50
=INT(I2)+1
(2)将“>=5”的price_level全都统一成5,运用“数据透视表”统计城市与价格之间的关系
替换
(3)将数据赋值到新的Sheet中,然后计算占比。
(9)问题九
问题:将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。
解答:运用log()
和“线性加权”
进行分析
步骤:
(1)剔除空值和异常值
(2)将“口味”
、“环境”
、“服务”
按不同权重线性加权后,形成新的一个指标。
(3)运用 log()
函数,将“点评”
缩小到1~5范围内(可以选任意底数)。
(4)运用 log()
函数,将“人均”
缩小到1~5范围内(可以选任意底数),人均取负值。因为价格越低,消费者会越喜欢。
(5)最后,将所有指标线性加权,形成综合评价系数
。
实现过程:
(1)控制第一行,点击“数据”,点击“筛选”;剔除空值和异常值;重新赋值到新的Sheet中。
(2)线性加权
(3)(4)运用 log()
函数
=LOG(D2,10)
=LOG(E2,5)
(5)线性加权,并按综合评价系数
排名。
注意: 各指标的权重,按需求而定。
(10)问题十
问题:对全国的日本料理,做一次描述性分析(开放题)
解答:运用“数据分析”
进行处理
步骤 和 实现过程:
(1)控制第一行,点击“数据”,点击“筛选”;将“类型”选成日本料理
;重新赋值到新的Sheet中。
(2)点击“数据”,点击“分析”,点击 “数据分析”
。
以上就是对全国的日本料理,做的一次描述性分析。