Mobile APP(Apple IOS app store)特性分析

Mobile APP(Apple IOS app store)特性分析

一、数据来源、分析目的和思路
1. 数据来源
IOS占据将近一半的智能手机市场,其App Store中有大量App,为了分析App特性,从Kaggle中找到一个相关数据集:
(https://www.kaggle.com/ramamet4/app-store-apple-data-set-10k-apps/home)
这份数据从Apple Inc website中的 iTunes Search API 提取而得。包含16个变量和7197条记录,变量基本信息如下:
表1 变量信息表

编号 变量 说明
1 “id” App ID
2 “track_name” App Name
3 “size_bytes” Size (in Bytes)
4 “currency” Currency Type
5 “price” Price amount
6 “rating_count_tot” User Rating counts (for all version)
7 “rating_count_ver” User Rating counts (for current version)
8 “user_rating” Average User Rating value (for all version)
9 “user_rating_ver” Average User Rating value (for current version)
10 “ver” Latest version code
11 “cont_rating” Content Rating
12 “prime_genre” Primary Genre
13 “sup_devices.num” Number of supporting devices
14 “ipadSc_urls.num” Number of screenshots showed for display
15 “lang.num” Number of supported languages
16 “vpp_lic” Vpp Device Based Licensing Enabled

2. 分析目的
基于变量,确定分析目的为“简略描述所有APP,以游戏APP为主进行特性分析”。
3. 分析思路
以所有版本评分均分(user_rating)为指标,筛选出“优质游戏APP”,以“一般游戏APP”为对照,统计描述二者不同变量下的特性。以此刻画优质游戏APP。最后尝试做一些变量的探索性分析。

二、 分析正文
1. 数据清洗
16个变量中,有5个分类变量,其余为数值变量;没有缺失值。采用箱线图结合变量实际意义,判断数据异常值。绘制箱线图如下:
这里写图片描述
图1 箱线图(分析异常值)

数据描述给出了数值变量的均值、最大值、最小值等信息。支持的语言数(lang. num)栏中,有数值为0的记录41条,查看此41条数据,发现其中19条总版本评论人数大于0(最大值为35735),由此推论lang.num=0可能为默认值,具有意义。所有currency支持类型都为“USD”,没有分析价值。
所有版本总评论人数(rating_count_tot)有数值为0的记录929条,观察这些记录,其rating_count_ver、user_rating和user_rating_ver都为0,且有659条记录的版本低于2.0.0(因按字典顺序进行比较,有9条版本10以上的记录被选出,但对总体无影响),假定这些为刚上新APP,未被下载使用,无太大分析价值,因此剔除这659条记录。其余数据均为合理值。
以下用ratings替代user_rating。

2.描述性分析
2.1 总体APP分析
在保留的6538条记录中,按APP类型绘制条形图,共有23种不同类型的APP,其中games类的APP一枝独秀,约为总数的53%
这里写图片描述
图2 APP类型计数条形图

对总体按不同类型APP进行比较,绘制箱线图如下:
这里写图片描述
图3 APP分类箱线图(异常值分析)

由图可知,游戏APP的大小分布较广;绝大多数APP的价格低于等于50,仅0.1%的APP价格大于50,其中分类为Education的两款APP价格最高(249.99,299.99);在rating_count_tot中,共有6个APP的评论数大于1×10^6,其中Social Networking中的Facebook一枝独秀,评论数最多,其次是Photo & Video中的Instagram,Games中的Clash of Clans和Temple Run,然后是Music下的Pandora - Music & Radio,最后是Social Networking中的Pinterest,果然生活离不开娱乐和社交,这些APP都免费;user_rating和ipadSc_urls.num数据分布不均,没啥可说的;sup_devices.num的P50为37,表明37比较常规。

2.2 游戏APP分析
2.2.1 优质游戏APP
在3462条游戏APP的记录中,绘制ratings计数柱形图,其中评分4.5的APP最多,占48%。由图可知,App Store里能生存的游戏几乎都是精品,用户们评分也很大方~~。
这里写图片描述
图4 游戏APP总版本评分计数柱形图

游戏APP的评论人数分为所有版本(rating_count_tot)和现行版本(rating_count_ver),均值分别为15 274和642。所有版本评分统计量更大,数据相对更可靠。因此,将所有版本评分人数超过均值以及ratings大于等于4.5的记录视为优质游戏APP(假定其为受欢迎APP),共有367个APP。则相对一般的游戏APP(假定其为相对不受欢迎APP)共有3095个。
2.2.2 size_bytes
367个优质游戏APP,size_bytes的均值为2.86*10^8,直方图如下。
这里写图片描述
图5 优质游戏APP-size_bytes计数条形直方图

其中最大的一款游戏叫做“World of Tanks Blitz”(ID“859204347”),评分4.5。综合ratings,rating_count_tot和size_bytes,“Head Soccer”最佳,强烈推荐。
相对一般的3095个游戏APP,size_bytes的均值为2.88*10^8,直方图如下。
这里写图片描述
图6 相对一般的游戏APP-size_bytes计数直方图

分析:优质游戏APP中,size_bytes较小的APP所占比例,比相对相对一般的游戏APP较小,可能越好玩的APP功能越齐全,所以越大。但二者总体的分布和差别不大。
2.2.3 price
367个优质游戏APP,price的均值为0.44,其中免费的APP有299个(81%),计数柱形图如下。
这里写图片描述
图7 优质游戏APP-price计数柱形图

相对一般的3095个游戏APP,price的均值为1.62,其中免费的APP有1643个(53%),计数柱形图如下。
这里写图片描述
图8 相对一般的游戏APP-price计数柱形图

分析:优质APP中,免费的所占比例更高,而且最高收费6.99比相对一般的APP(29.99)更低,符合常识,免费的东西用户更愿意尝试,当然更受欢迎啦。
2.2.4 rating_count_ver
367个优质游戏APP,rating_count_ver的均值约为3600,直方图如下。
这里写图片描述
图9 优质游戏APP-rating_count_ver计数条形图

相对一般的3095个游戏APP,rating_count_ver的均值为291,直方图如下。
这里写图片描述
图10 相对一般的游戏APP-rating_count_ver计数条形图

分析:二者分布类似,可能因为现行版本刚上新,评论数较少。但优质游戏APP的评论均数远大于相对一般的游戏APP,到底口碑在,愿意更新和使用的玩家更多,评论数就多。
2.2.5 cont_rating
优质游戏APP的内容等级计数柱形图如下,支持4+的有57%
这里写图片描述
图11 优质游戏APP- cont_rating计数柱形图

相对一般的游戏APP的内容等级计数柱形图如下,支持4+的54%
这里写图片描述
图12 相对一般的游戏APP- cont_rating计数柱形图

分析:由图可知,支持4+的游戏APP较多,因为年龄限制越小,潜在用户越多;同时也表明app store中难度较小,老少皆宜的游戏APP更受欢迎。
2.2.6 sup_devices.num
优质和相对一般的游戏APP的支持设备计数柱形图分别如下。
这里写图片描述
图13 优质游戏APP- sup_devices.num计数柱形图
这里写图片描述
图14 相对一般的游戏APP- sup_devices.num计数柱形图

二者无明显差别,总的来说支持37、38个设备的APP数最多,算是最佳支持设备数,为APP开发作参考。
2.2.7 ipadSc_urls.num
优质和相对一般的游戏APP的截屏展示计数柱形图分别如下。
这里写图片描述
图15 优质游戏APP- ipadSc_urls.num计数柱形图
这里写图片描述
图16 相对一般的游戏APP- ipadSc_urls.num计数柱形图

二者无明显区别。绝大多数截屏展示数为5,表明5为最佳。
2.2.8 lang_num
优质和相对一般的游戏APP的语言支持计数直方图分别如下。
这里写图片描述
图17 优质游戏APP- lang_num计数直方图
这里写图片描述
图18 相对一般的游戏APP- lang_num计数直方图

总的来说,大多数APP支持1种语言,优质APP支持多语言的比例,比相对一般的APP多一些。因为英语是全球通用语言,为了减少APP开发成本,推测大多数APP仅支持英文。
2.2.9 vpp_lic
优质游戏APP vpp_lic全部为1,相对一般的游戏APP vpp_lic 99.5%为1,因此vpp_lic主要为1,无太大分析意义。
2.2.10 APP名字词云图
优质APP名字词云图:
这里写图片描述
图19 优质游戏APP名字词云图

由图可知,游戏名字含有“Game”的最多,为了让用户易于分辨APP类型,就要简单粗暴加上“Game”一词。此外“Angry Birds”出现较多,共有11个APP,Angry Birds是由Rovio开发的一款休闲益智类游戏,于2009年12月首发于iOS,可谓全球首款取得真正主流成功的手机游戏,至此将近10年,经久不衰,在相对不受欢迎的游戏APP中,也有7款由其衍生的APP。这些游戏都免费,且适合4+用户,老少皆宜。如果想再开发同款游戏,还望三思而后行,虽然Angry Birds势头很猛,但可能市场已经饱和了哦。其他高频重点词汇:Free、World、HD、Puzzle、Racing等。
以上为关于游戏APP的描述性分析,为了充分运用数据,接下来尝试做一些探索性分析。

3.探索性分析
经过S-W正态性检验,发现本例中的游戏类数据都不服从正态分布,不能采用pearson积矩相关系数,应采用spearman秩相关系数rs衡量变量之间的相关性(异常点会干扰结果),结果如下:
这里写图片描述
图20 游戏APP变量rs热图

一般认为,rs ≥ 0.3变量间有相关关系。因n = 3462>50,所以对(rating_count_tot & rating_count_ver)和(user_rating & user_rating_ver)两组数据作rs = 0的 t 检验,二者P < 0.001,可以认为有统计学意义,即两组变量之间都有一定正相关。但结合实际意义,这两对数据没有分析线性的必要。

三、总结与建议
综上,优质游戏APP的特征为:
size_bytes均值2.86*10^8,功能越齐全,越大,可能更受欢迎;
免费;
口碑好的游戏,新版本也更热,相比开发新游戏,完善已有的游戏更保险;
最好支持4+;
最佳支持设备数为37或38;
展示5张游戏截屏;
可支持多语言,广撒网,但成本也会因此提高;
游戏名字里加上“Game”,让用户一眼明白APP类别,快准狠!

以上就是关于mobile app分析的全部内容,希望各位大佬多多指正,不吝赐教♡。

猜你喜欢

转载自blog.csdn.net/qq_41254399/article/details/81461575