运用Excel进行数据分析

(1) 有些时候,可以利用Excel进行简单的数据分析,写数据报表时也会运用到,针对案例,使用Excel的部分功能来实现以下目标。

(2) 现在你有一份的餐食数据,我想通过excel知道以下问题:
  1. 全国点评数最高的饭店是哪家?
  2. 哪个城市的饭店人均口味最好?
  3. 哪个类型的餐饮评价最好?
  4. 类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?
  5. 口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最
多?
  6. 上海地区中,各个类型饭店服务前五名?
  7. 没有评价的饭店有几家?
  8. 将人均价格划分成0~ 50 , 50~ 100 , 100~ 150 , 150~ 200 , 200+这几个档次,各个城市分别有几家?其中占比又是多少?
  9. 将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。
  10. 对上海地区的日本料理,做一次描述性分析(开放题)

(3) 数据:
           

链接: 数据下载
提取码:2ns3


(1)问题一

问题:全国点评数最高的饭店是哪家?
解答:运用 INDEX()MATCH() 进行数据分析

步骤:
(1) 找出点评数最高的值var
(2) 通过 INDEX() 函数来进行var在“点评”列中的坐标定位,再通过 MATCH() 进行店名中的坐标查找

实现过程

(1) 找出点评数最高的值var

=MAX(D:D)

(2) 找出点评数最高的饭店是哪家?

=INDEX(C:D,MATCH(21180,D:D,0),1)

最后,得到的结果是:

(2)问题二

问题:哪个城市的饭店人均口味最好?
解答:运用 数据透视表 进行数据分析

步骤 和 实现过程:
(1)全选表格,点击“插入”,点击“数据透视表”。
           
(2)创建数据透视表
           
(3)选择行:城市;选择列:口味;选择 “值字段设置” :平均值
           

最后,进行数据排序,人均口味最好的城市是上海, 最高约为:7.95

(3)问题三

问题:哪个类型的餐饮评价最好?
解答:运用 数据透视表 进行数据分析

针对问题三,同样按照问题二的步骤。
最后,对数据进行排序,餐饮评价最好的类型是火锅, 最高约为:80589
                 

(4)问题四

问题:类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?
解答:运用 COUNTIF() 进行数据分析

步骤:
(1) 运用 COUNTIF()统计每个店名中出现「麻」的字数
(2) 运用 COUNTIF()统计每个店名中出现「辣」的字数
(3) 控制第一行,点击“数据”,点击“筛选”;将“类别”选成“川菜”;最后,统计「麻」,「辣」列中有多少个带「辣」字,又有多少个带「麻」字

实现过程

(1) 新增一列,运用 COUNTIF()统计

=COUNTIF(C2,"*麻*")
=COUNTIF(C2,"*辣*")

(3) 统计个数
           
结果:
  统计「麻」个数:28
  统计「辣」个数:44
  可以大致了解到类型为川菜的店名,同时在「麻」和「辣」两个字做选择,普遍爱好「辣」字。

(5)问题五

问题:口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最
多?

解答:运用 “筛选” 进行数据分析

步骤 和 实现过程:
(1)控制第一行,点击“数据”,点击“筛选”;将“口味”,“环境”,“服务”选成8.0以上;
           
(2)统计饭店的数量,重新复制“城市”,运用数据透视表 统计并描述“城市”的信息。
                 

结果:
  统计饭店的数量:457
  北京占比最多。

(6)问题六

问题:上海地区中,各个类型饭店服务前五名?
解答:运用 IF()“筛选” 进行数据分析

步骤 和 实现过程:
(1) 控制第一行,点击“数据”,点击“筛选”;将“城市”选成“上海”;选择“城市”、“类型”、“店名”、“服务”指标后,赋值到新的Sheet中。
           

(2) 首先对“服务”降序;再对“类型”进行降序(都是扩展到整个区域)。
           
会发现类型相同的店,它们的服务是降序排列。

(3) 按数字递增来描述“类型”,用到:IF()函数。
           

(4) 接下来,筛选第“E”列前五名"<=5"。
           
           
最后得到了,各个类型饭店服务前五名。

(7)问题七

问题:没有评价的饭店有几家?
解答:直接对数据进行操作

步骤 和 实现过程:
直接筛选“点评”为空格,再统计类型的总数就是空格的总数,得到没有评价的饭店有1355家。

(8)问题八

问题:将人均价格划分成0~ 50 , 50~ 100 , 100~ 150 , 150~ 200 , 200+这几个档次,各个城市分别有几家?其中占比又是多少?
解答:运用 “除”“取整” "数据透视表" 进行数据分析

步骤 和 实现过程:
(1)运用“除”“取整” 将人均价格分段。
           

=E2/50
=INT(I2)+1

(2)将“>=5”的price_level全都统一成5,运用“数据透视表”统计城市与价格之间的关系
           
替换
           
                
(3)将数据赋值到新的Sheet中,然后计算占比。
           

(9)问题九

问题:将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。
解答:运用 log()“线性加权” 进行分析

步骤:
(1)剔除空值和异常值
(2)将“口味” “环境” “服务” 按不同权重线性加权后,形成新的一个指标。
(3)运用 log()函数,将“点评” 缩小到1~5范围内(可以选任意底数)。
(4)运用 log()函数,将“人均” 缩小到1~5范围内(可以选任意底数),人均取负值。因为价格越低,消费者会越喜欢。
(5)最后,将所有指标线性加权,形成综合评价系数

实现过程:
(1)控制第一行,点击“数据”,点击“筛选”;剔除空值和异常值;重新赋值到新的Sheet中。
(2)线性加权
           
(3)(4)运用 log()函数
           

=LOG(D2,10)
=LOG(E2,5)

(5)线性加权,并按综合评价系数 排名。
           

注意: 各指标的权重,按需求而定。

(10)问题十

问题:对全国的日本料理,做一次描述性分析(开放题)
解答:运用 “数据分析” 进行处理

步骤 和 实现过程:
(1)控制第一行,点击“数据”,点击“筛选”;将“类型”选成日本料理;重新赋值到新的Sheet中。
           

(2)点击“数据”,点击“分析”,点击 “数据分析”
           
           
         
以上就是对全国的日本料理,做的一次描述性分析。

猜你喜欢

转载自blog.csdn.net/qq_41709378/article/details/107119521