上海の中古住宅データの分析
gcc の学生は盗作をしてはいけません。
実験時間 2023-05-6
1. 実験装置または材料
ラップトップ、Anaconda ソフトウェア
2. データと需要の説明
1. データの一部は次のとおりです。
2. 要件
このデータを利用するには、以下の点を分析する必要があります。
1. 上海の中古住宅の全体的な価格の説明
2. 上海の中古住宅の単価の分布
3. 上海の中古住宅の単価の分布4.上海の各都市部の
住宅資源の分析
5. 上海の住宅価格と住宅の広さの関係
6. 上海の中古住宅の諸側面の相関分析。
3. 実験内容と分析
0. ファイルを読み取り、データを探索および分析します。
1. 上海の中古住宅価格相場の概要
分析: 上海の中古住宅価格の平均価格は 580 万です。住宅価格が非常に高いことがわかります。上海の住宅価格が高い理由は主に 2 つあります。1 つ目は、上海が発展した住宅価格であることです。経済的で全体的な価格は比較的高いです。2つ目は、上海の土地面積が狭く、商業住宅の供給が不足していることです。
2. 上海の中古住宅の単価分布
分析:
1. 上海の中古住宅の全体的な単価は比較的低く、住宅の約 80% は平方メートルあたり 10 万元未満の価格です。
2. 坪単価が5万元/平方メートル未満に集中しているということは、上海市民の住宅価格に対する許容度が低く、手頃な価格の住宅に対する需要が多いことを示している。
3.10 15 万元/平方メートルと 15 万~ 20 万元/平方メートルの 2 つの範囲の単価も比較的一般的であり、高級アパート、別荘、その他の住宅供給源が依然として一定数存在することを示しています。
3. 上海各都市部の単価と総額の分布
この図から、浦東エリアでは住宅の単価と総額が10万~20万の間に集中していることが分かります。ただし、住宅の単価は家の大きさにも大きく関係しており、小規模住宅の単価は非常に高くなることが多く、大型住宅よりも高価になります。他のエリアでは、平均単価は比較的集中していますが、平均総価格は立地、交通、住宅地などの要因に関連して多少異なります。
4. 上海の各都市地域における住宅資源の分析
住宅数が最も多い地区は徐匯、閔行、浦東の 3 地区であり、この 3 地区は地理的位置や学区などの様々な要因から、上海の中でも比較的質の高い住宅地の一つと考えられており、このエリアの物件数は比較的多いです。
しかし、崇明や金山などの都市部では住宅が少なく、中心部から遠く離れた地域が多く、開発業者による開発不動産が不足していることなどの理由もある。
龍華、長寧、普陀などの都市部はいずれも住宅数が比較的多く、各都市部の分布理由をさらに理解するには、地理的距離、インフラ、産業などを総合的に分析する必要がある。
住宅の価格は必ずしも戸数だけで決まるわけではなく、面積、住戸タイプ、階数、向き、築年数、地域環境などの複数の要因によって価格が決まります。したがって、不動産市場をより深く理解するには、発売の予測と決定に基づいて、上記のさまざまな要因を総合的に考慮する必要があります。
5. 上海の住宅価格と住宅の大きさの関係
住宅価格と面積の間には一定の正の相関関係があります。住宅面積が大きくなるにつれて、平均単価は徐々に下がっていきます。
建築期間の観点から見ると、初期に建てられた物件の方が価格が高くなる可能性があります。ただし、このこの法則がすべての場合に当てはまるわけではなく、例えば古い住宅などは地域や立地などの影響で価格が高騰する場合もあります。
面積、階数、向きなどの観点から見ると、さまざまな属性も住宅価格に影響を与えます。中心部に位置し、南向きの低層階の方が一般的に人気が高く、価格も高くなります。
6. 上海の中古住宅のさまざまな側面の相関分析。
1. 住宅面積と住宅価格には正の相関関係があり、面積が広いほど住宅価格は高くなる
2. 地区と住宅価格、および各地域の住宅価格の間には明らかな正負の相関はない地域によって大きく異なります。
3. 階数と住宅価格の間にも一定の相関関係があり、多くの場合、階数が高いほど住宅価格は安くなります。
4. 方位と住宅価格には明確な相関関係はないが、南向きの住宅の人気が高く、価格は他の方位に比べてやや高め 5. 建築期間と住宅価格には一定の相関関係もあり、基本的には早ければ早いほど
良い建設期間が長ければ長いほど、住宅価格は高くなります。
4. 結論と経験
- まず、住宅販売データを DataFrame に保存する必要があります。パンダの read_csv 関数を使用して csv ファイルを読み取るか、read_excel 関数を使用して Excel ファイルを読み取ることができます。
- 次に、DataFrame の各列の基本統計 (カウント、平均、標準偏差、最小値、25%!、75%!、(MISSING) 最大値など) を、describe 関数を通じて取得できます。
- さらに、groupby 関数を使用して特定の列に従ってデータをグループ化し、agg 関数を使用して、各都市の平均住宅価格や販売量などのデータの各グループの統計を計算できます。
- もちろん、プロット機能を使用して、ヒストグラム、ヒストグラム、散布図などを描画するなど、データの視覚的な分析を実行することもできます。
- 最後に、特定の都市の販売状況の理由を分析したり、将来の販売傾向を予測したりするなど、実際のビジネス シナリオと組み合わせてデータの詳細な分析とマイニングを実行する必要があります。
個人的な経験: pandas ライブラリを使用すると、データの統計と分析を迅速かつ簡単に実行でき、特に大規模で複雑なデータを扱う場合、作業効率が大幅に向上します。同時に、パンダの一般的な機能とメソッドに習熟すると、データ サイエンティストやビジネス アナリストに強力なツール サポートを提供し、彼らの仕事に多くの利便性と支援をもたらします。