私は最初の層の都市に大規模なデータを持つ1000人の以上の雇用募集のニーズを解析し、仕事の科学を見つける方法を教えて

毎年3月と4月には、我々はまた、多くの場合、金や銀3 4金の募集期間と呼ばれる、として高給、ボーナスを取得するには、仕事を探しているキャリアの人々がドラマの年間計画を開始するために行わ年間の要約の今回ピーク募集です業界のIT産業の一つは、プログラマは狂気とモルタル事務所のお気に入りを行くことを始めています。

ITの人として、我々は、オンライン募集の多様からの仕事の満足度を見つけるために、どのように、彼らの専門知識にプレイしていますか?私は北京、広州、深センC ++求人情報の3つの第1層の都市は、テキストスペースの制限は、唯一、北京、深センのデータ分析を思い付く私たちは成功率を向上させるために科学を適用するために、現在の状況リクルートC ++ジョブ、および方法を見てみましょうするために分析しました。

高精細グラフィックス、必要とシークの学生のこの分析を共有するテキストの終わり。同時に、私は学習交流のためのソースコードを共有し、あなたは自分のソースコード解析上のジョブを実行できるかどうか興味が他。

要求分析

採用募集のウェブサイトに公表されたデータ、取得した後の分布域、給与、学術的要件、職務要件キースキル、人材マッチングを分析することによって特徴は何ですか?ヘルプ候補がそれぞれの能力、パッド入りのショートボードを向上させるために、目標応答代理店募集の学校の募集は、募集のお気に入りを取得する究極の目標を達成するために。

ソフトウェア設計

データ分析は、Pythonで実装Pythonの強み、プロジェクトです。データ収集とデータ分析:ソフトウェアは、2つのモジュールに分かれています

アーキテクチャ.PNG

詳細な実装

データ収集

データ要求ライブラリーの構築を要求

cookie = s.cookies
req = requests.post(self.baseurl, headers=self.header, data={'first': True, 'pn': i, 'kd':self.keyword}, params={'px': 'default', 'city': self.city, 'needAddtionalResult': 'false'},   cookies=cookie, timeout=3)
text = req.json()

csv形式で保存されたデータ

with open(os.path.join(self.path, '招聘_关键词_{}_城市_{}.csv'.format(self.keyword, self.city)), 			   'w',newline='', encoding='utf-8-sig') as f:
    f_csv = csv.DictWriter(f, self.csv_header)
    f_csv.writeheader()
    f_csv.writerows(data_list)

データ分析

前処理場

df_all.rename({'职位名称': 'position'}, axis=1, inplace=True) #axis=1代表index; axis=0代表column
df_all.rename({'详细链接': 'url'}, axis=1, inplace=True)
df_all.rename({'工作地点': 'region'}, axis=1, inplace=True)
df_all.rename({'薪资': 'salary'}, axis=1, inplace=True)
df_all.rename({'公司名称': 'company'}, axis=1, inplace=True)
df_all.rename({'经验要求': 'experience'}, axis=1, inplace=True)
df_all.rename({'学历': 'edu'}, axis=1, inplace=True)
df_all.rename({'福利': 'welfare'}, axis=1, inplace=True)
df_all.rename({'职位信息': 'detail'}, axis=1, inplace=True)
df_all.drop_duplicates(inplace=True)
df_all.index = range(df_all.shape[0]) 

データ処理ショー

from pyecharts.charts import Bar
regBar = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
regBar.add_xaxis(region.index.tolist())
regBar.add_yaxis("区域", region.values.tolist())
regBar.set_global_opts(title_opts=opts.TitleOpts(title="工作区域分布"),
                     toolbox_opts=opts.ToolboxOpts(),
                     visualmap_opts=opts.VisualMapOpts())
                     
from pyecharts.commons.utils import JsCode
shBar = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
shBar.add_xaxis(sala_high.index.tolist())
shBar.add_yaxis("区域", sala_high.values.tolist())
shBar.set_series_opts(itemstyle_opts={
            "normal": {
                "color": JsCode("""new echarts.graphic.LinearGradient(0, 0, 0, 1, [{
                    offset: 0,
                    color: 'rgba(0, 244, 255, 1)'
                }, {
                    offset: 1,
                    color: 'rgba(0, 77, 167, 1)'
                }], false)"""),
                "barBorderRadius": [30, 30, 30, 30],
                "shadowColor": 'rgb(0, 160, 221)',
            }})
shBar.set_global_opts(title_opts=opts.TitleOpts(title="最高薪资范围分布"), toolbox_opts=opts.ToolboxOpts())

word.add("", [*zip(key_words.words, key_words.num)],
         word_size_range=[20, 200], shape='diamond')
word.set_global_opts(title_opts=opts.TitleOpts(title="岗位技能关键词云图"),
                     toolbox_opts=opts.ToolboxOpts())

データ分析

地域的分布

C ++の仕事地域分布、北京、深センVS
北京との比較 - 深セン

また、村Xibeiwang工場の町に位置中関村、海淀区に位置してC ++より多くの雇用北京、深センでよりバフ祝福の首都、そして海淀区と朝陽の2つの領域に集中し、海淀区、数、テンセント、滴、Baiduの、シーナ、網易これらのインターネットの巨人は、当然より多くの雇用を提供し、一緒に取得します。

ジョブは推測ガチョウの工場C ++のメーカーが偶数秒で、南山区、宝安区に大きなシェアを貢献し、南山区、深センに集中しています。

度分布

C ++ジョブ資格分布、北京、深センVS
教育コントラスト - 北京、深センの.jpg

教育の学士号は、市内の2を占め、北京ポスト大学院大学を占め、80%以上であり、かなりの必要があります。最も目に見える位置は学士号は有能することができ、あなたはあなたにいくつかの参照をいないテスト勉強のセクションを行う絡まっ卒業与えることができます。

あなたは専門家の資格がある場合は、あなたが仕事のない多くが残っているので、私たちは、私たちの努力を倍加する必要があります。一方、ビューのチャートポイントからのデータは、深セン大学の学生のためのジョブと修士学位のための需要の10%は、参照のみを目的として... emmm、友好以上に北京におそらく深センに、わずか2%を占めました。

給与配布

C ++ジョブ給与の分布、給与計算ユニットK.
北京の最高、最低賃金給与VS

深セン最高最低賃金給与VS

言うべき給与の比較は何も、誰もがプラグイン話すが、本当に豊富で強力な帝国を言いたいん。

スキル準備

C ++職業技能の重要な単語の雲、北京、深センVS

問題解決能力をプログラミング開発から管理職までの前にまず第一に、最も重要な、あなたは「プログラミング」スキル・ワードクラウドの面で能力の最大の割合を見ることができます。

仕事のスキルの単語雲を見ることができる、仕事のほとんどはそうあなたが学校にいるかの大学や募集のための学生を準備するために、より高い「アルゴリズム、データ構造、Linuxでは、データベース(記憶装置)、マルチスレッド(オペレーティングシステム)」の基本的なコンピュータリテラシーが必要です終了する準備ができて職場老人、あなたはこれらの基本的なコンピュータスキルの良い準備を必要としています。

一方、ソフトパワーのための求職者も必要ですハードコア技術的な要件は、例えば、私たちはこれらの機能のための「チーム、コラボレーション、学習、コミュニケーション」候補者のためのより多くの好みを持って、私たちは同時に技術力を向上するだけでなく、これらのソフトに注意を払うを削除筋力トレーニング。

卵。C ++開発ジョブの要件は、比較的あなたは、これら2つのプラットフォームのための特別な好みを持っていない場合、開発者は合格者を増やすためにLinuxで学ぶことができるようになるので、より大きなワードクラウドを占めLinuxのLinuxとウィンドウC ++開発の下で話しています率。

「学校のプログラムレモン」完全な紙のプログラムのソースコード分析と定義チャートを取得するために「仕事」にはありません公共の返信で。


、巨大なプログラマそれらのものの技術学習とあなたを持つプログラマを共有するためのユーザーフレンドリーな方法で、十年以上の学習経験をプログラミング「アカデミーをプログラミングレモン」社会的関心のよりエキサイティングな元の数。
デフォルトのファイル1583420069417.png

公開された23元の記事 ウォンの賞賛6 ビュー9745

おすすめ

転載: blog.csdn.net/u011644231/article/details/104741589