データ分析は--5日が10億人の反乱軍、なぜ、このような火災を破るために、Pythonは、分析しました

  最近彼女の友達がアムウェイ私に漫画映画「魔法少年の反乱軍の世界に入って来た」と呼ばれ、映画にそこに行くされていた場合、私は知りません。誰もが、例外なく、非常に素晴らしいと言います。

  燃えるドラマ「親愛なる愛」の検索インデックスは、本当に、22倍も高いことがディズニーの「ライオンキング」よりも、火のほぼ6倍の高さよりも、最近のマイクロチャネルの検索インデックスを見てください。

  、9.7ポイントほど高いスコアスコアはほぼ84百万人で、表示された結果についてのビューのキャッツアイポイントを移動します。これは本当に良いドラマを読んで、人々が言っ​​ていることを取るために登ると、波解析、およびいくつか面白いものを見つけました。

  

1.データを取得します

  最初は、データが比較的単純であるクロール、クロールに関するデータである、我々はあなたが次のレビューを見ることができ、フィルムのウェブサイト内キャッツアイネットワークを開く必要があります。:開発者モードでは、モバイル端末への切り替え、我々が密接に見れば、以下のように批評家は、、批評家は、動的にロード、見つけることができることがわかります

  動的なロードは、その後、私たちは、つまり、あなたが動的にロードされたJSONデータページを見つけることができ、よく見て、ネットワークの下のXHRで、我々はクロールしたいデータを必要としています。図に示すように。

図に示すように、次の簡単なクロール爬虫類、およびコードの一部です。

クロールプロセスは非常に簡単です、電話回線の終端を通過した後、サイクルクロールは、構文解析は、BSを使用して、JSONファイルとして保存することができます。

 

2.データの分析

データをクロールした後、データが次に分析され、上記のデータ、5000人以上は、おそらくあります。(まず、できる分散型クローラを使用するために非常に同時必要数十万5000を登ります)

登っセックスのレビュー(0は、不明である女性のための男性のための1、2)、学年、都市、評価、およびレビュー。

 

映画批評家の3分析

パイソンの多くの視覚的な分析ツールを実行し、ライブラリを使用するのは比較的軽量で簡単にpyechartsです。私たちは、ほぼ5000批評家データの視覚的な結果を簡単に見て参照してください。

 

1)総合的な評価

9.7ポイントの全体的なスコアで「US」猫の目、得点は間違いなく非常に高いです。など、国内のアニメーションよりも「白蛇。」スコア分布から、スコアの最もが全体の7.7%を占め、4.5ポイントに続く、合計86.5%を占め、アウト与え、次の3点に与えられたが、FAの数の5%未満の非常に小さいです届きにくい知るために、フィルム中の負のフィードバックの割合が非常に低いとみなすことができます。

 

2)性差

通常来说这种国产动画的“大片”比较符合大众口味,从评论者性别分布数据来看,虽然有接近一半的人不愿透露性别,但从已知数据判断,观影男女比例约为1:1多一点,女性观众的比例稍微高一点。

 

3).城市分布

接下来小编分析了评论者所在的城市分布。首先是直方图的来粗略的展示前十大热门的影迷城市,如下图所示:

 

 

  直方图的展示不是很直观也不全面,因此,小编采用地图的形式,为大家更加直观的进行展示,由于观影者的城市地理位置可能没有出现在程序的设置中,因此,小编只选取了观影城市最多的前八十个城市作为动态展示,如下图所示:

4).评论内容

首先整合评论内容,然后利用wordcloud库绘制词云图,从词云分析情况来看,满屏的“好看”,“不错”,“特效”等赞美的词语,与以往的电影不同的是,“剧情”,“故事”等字眼也特别醒目。

 

おすすめ

転載: www.cnblogs.com/LCharles/p/11311639.html