私のコード コラムはすべて、基本的な python データ分析の群集を対象としています。たとえば、学部の卒業論文やコース論文を書きたい場合、簡単なケース分析を行う場合などです。過去に書かれた事例は、機械学習や深層学習の手法を多用しすぎて文系の学生には理解できず、Pythonを使って回帰や絵を描きたいだけなのかもしれません。冒頭では、経済ニュースなどの人文・社会科学分野の事例に適した簡単な事例を紹介します。
(もちろん、修士論文、上級モデル、複合モデル、混合モデルなどに適したモデルケースもあるでしょう)
ケースの背景:
この調査の背景は、さまざまな種類の上場銀行の財務指標を比較することです。主に国有銀行、株式銀行、都市商業銀行の 3 種類の上場銀行を対象としています。
主な財務指標は次のとおりです。
[「1 株あたりの利益 (元)」、「1 株あたりの純資産 (元)」、「1 株あたりのキャッシュ フロー (元)」、「純利益 (元)」、「総営業利益 (元)」、 「総資産(元)」、「ROE」、「総資本(株)」]
1. 研究デザイン
1.1 サンプルデータのソース
この記事のデータは Flush から取得したもので、2022 年第 1 四半期の上場銀行 32 行の重要な財務報告データを選択しています。そして、銀行を国有銀行、株式銀行、都市商業銀行の 3 つのカテゴリに分類し、記述統計分析を行い、さまざまな種類の銀行の財務データを比較し、結論と意見を引き出します。
データは次のようになります。
1.2 可変会社の選択
選択された重要な財務データには、「1 株あたりの利益 (元)」、「1 株あたりの純資産 (元)」、「1 株あたりのキャッシュ フロー (元)」、「純利益 (1 億元)」、「営業総収入」が含まれます。 (億元)」、「総資産(億元)」、「純資産利益率」、「総資本(億株)」。
選択された 32 のバンクは、下の表に示すように、3 つのタイプのバンクに分けられます。
株の略称 |
タイプ |
株の略称 |
タイプ |
建設銀行 |
国営銀行 |
寧波銀行 |
シティコマーシャルバンク |
通信銀行 |
国営銀行 |
成都銀行 |
シティコマーシャルバンク |
郵貯銀行 |
国営銀行 |
杭州銀行 |
シティコマーシャルバンク |
ICBC |
国営銀行 |
南京銀行 |
シティコマーシャルバンク |
ABC |
国営銀行 |
長沙銀行 |
シティコマーシャルバンク |
中国銀行 |
国営銀行 |
貴陽銀行 |
シティコマーシャルバンク |
中国招商銀行 |
株式銀行 |
重慶銀行 |
シティコマーシャルバンク |
産業銀行 |
株式銀行 |
上海銀行 |
シティコマーシャルバンク |
上海浦東発展銀行 |
株式銀行 |
江蘇銀行 |
シティコマーシャルバンク |
平安銀行 |
株式銀行 |
北京銀行 |
シティコマーシャルバンク |
中信銀行 |
株式銀行 |
蘇州銀行 |
シティコマーシャルバンク |
民生銀行 |
株式銀行 |
厦門銀行 |
シティコマーシャルバンク |
HSBC銀行 |
株式銀行 |
齊魯銀行 |
シティコマーシャルバンク |
浙商銀行 |
株式銀行 |
青島銀行 |
シティコマーシャルバンク |
中国光大銀行 |
株式銀行 |
鄭州銀行 |
シティコマーシャルバンク |
西安銀行 |
シティコマーシャルバンク |
||
蘭州銀行 |
シティコマーシャルバンク |
2. 実証研究
まず、Excel を使用して、次のように 3 次元のパーセンテージ柱状積み上げ図を作成します (Excel で描画を教える必要はありません....)。
図に示すように、1 株あたりのキャッシュ フローがマイナスになる可能性があるなど、データ分布のいくつかの特徴を見ることができます。また、さまざまな銀行のそれぞれの財務指標には独自の特性があり、以下でさらに計算されます。
Pythonで計算を開始する方が簡単です。
最初にパッケージをインポートします。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams ['font.sans-serif'] ='SimHei' #显示中文
plt.rcParams ['axes.unicode_minus']=False #显示负号
sns.set_style("darkgrid",{"font.sans-serif":['KaiTi', 'Arial']})
データを読み取り、最初の 5 行を確認します。
data=pd.read_excel('银行数据.xlsx')
data.head()
記述統計、各指標 (平均、分散、四分位数など) の基礎となる統計を計算します。
data.describe()
グループ集計、銀行の種類ごとにグループ化し、これらの指標を計算します。
次の表に示すように、変数、平均、分散、四分位数、中央値、最大値、最小値などの数を含む、3 つの銀行のデータの記述統計指標を計算します。
data.groupby('类型').describe().T#.to_excel('描述性统计.xlsx')
図に示すように、異なる銀行タイプの各指標間の異なる統計の違いを比較できます。
インジケーターが多すぎて表示できません。上記のコードの「#」を削除し、ローカルの Excel テーブルに保存して表示することができます。
表から、各銀行が各財務指標の独自の統計を持っていることがわかりますが、値は十分に直感的ではなく、比較に役立ちません. 以下に、比較のためにすべての財務データの相図を示します。
まず、インジケーター名であるヘッダーを見てください。
column = data.columns.tolist()[1:-1] # 列表头
column
描く
fig = plt.figure(figsize=(6, 12), dpi=256) # 指定绘图对象宽度和高度
for i in range(8):
plt.subplot(4,2, i + 1) # 2行3列子图
ax = sns.boxplot(x='类型',y=column[i],width=0.8,orient="v",data=data)
#ax = sns.violinplot(x='类型',y=column[i],width=0.8,saturation=0.9,lw=0.8,palette="Set2",orient="v",inner="box",data=data)
plt.xlabel(('银行类型'),fontsize=8)
plt.ylabel(column[i], fontsize=8)
plt.tight_layout()
plt.savefig('银行箱线图.jpg', dpi=256)
plt.show()
上記から、いくつかの結論を導き出すことができます。
さまざまな財務指標を以下に分析します。
1. 1 株当たり利益の観点から見ると、国有銀行の分布は比較的集中しており、1 株当たり利益の平均と中央値は比較的低い。株式会社株銀行には 2 つの外れ値があり、1 株あたりの利益が特に大きい銀行が 2 つあることがわかります。結論としては、株式会社型銀行の 1 株当たり利益は、都市商業銀行や国有銀行よりも高いということです。
2. 1 株当たりの純資産の観点から、結論は 1 株当たりの利益と同様であり、株式銀行の分布も比較的分散しており、1 株当たりの平均純資産は都市商業銀行や国営銀行よりも高くなっています。所有銀行。
3. 1 株あたりのキャッシュ フローの観点から見ると、一部の株式銀行はキャッシュ フローがマイナスで、国有銀行のキャッシュ フローは高くありませんが、分布は非常に集中しており、国有銀行のキャッシュ フローが銀行は比較的十分で安定しています。
4. 純利益に関しては、国有銀行は株式銀行や都市商業銀行よりもはるかに高い。これは、私の国の国営銀行の市場シェアに関連しています。
5.総営業利益と純利益の観点から見ると、国有銀行は株式銀行や都市商業銀行よりも高い。国有銀行の営業利益と利益が非常に高いことを示しています。
6.総資産の観点から見ると、国有銀行の総資産は株式銀行や都市商業銀行よりもはるかに高く、私の国の国情と非常に一致しています。人々の預金の大部分は、国営銀行にあります。
7. 純資産利益率の観点から見ると、国有銀行、株式銀行、都市商業銀行の平均利益率は類似しており、都市商業銀行には異常点があり、国有銀行の分布はより多くなっています。濃縮。
8. 総株式資本に関しては、国有銀行は株式銀行や都市商業銀行よりもはるかに多い。
3. 結論
上記の分析から、次の結論を引き出すことができます。
- 国有銀行は、総資産、株式資本、営業利益、利益の点で、株式銀行や都市商業銀行よりもはるかに高く、これは私の国の国情とも非常に一致しており、市場シェアは特に高い.
- 純資産利益率と 1 株あたりのキャッシュ フローの観点から見ると、国有銀行、株式銀行、都市商業銀行の平均値は類似しており、国有銀行の分布がより集中しており、その傾向が示されています。資産利益率と 1 株あたりのキャッシュ フローがより安定します。
- 1 株当たりの利益と 1 株当たりの純資産の観点から、株式銀行は都市商業銀行や国有銀行よりも大きい。証券投資の観点からは、株式銀行への投資を優先すべきであることを示しています。