[Ch05-00]多変量線形回帰問題

シリーズのブログ、GitHubの上で維持原作者:https://aka.ms/beginnerAI
より多くの意味するものではありません星と星をクリックして、著者難しく星。

単一多入力1出力のニューラルネットワークの第5章

以上の5.0線形回帰の問題

質問する5.0.1

質問:北京通州、通州区、93平方メートルの家の中心部から15キロ、どのくらいのお金はどうですか?

料金予測問題は、機械学習、すでに有名なボストンの住宅データと関連する競技のエントリー多くの話題となっているが、米国は早く、裏庭スイミングプール、非常に多くのパラメータ前庭一戸建て住宅、ガレージです学者は理解しにくいかもしれません。私たちは、例えば、予測価格のプロセスを感じるために北京通州価格の簡易版を使用することができます。

北京通州価格に影響を与える要因には、リビングエリア、地理的な位置、向き、学区の家、周囲の施設、建物や多くあるので、これは、地域や場所のより重要な要因の2つです、年に。一緒従って、我々は通州区の中心になるようにそれを変換し、理にかなって、緯度と経度の位置情報は、一般的に表現する方法を用いるが、緯度と経度は、二つの特性値です。

各サンプルは、2つの値が、値タグ、表5-1に示すように、実施例を有する我々は、1000個のサンプルを有しています。

表5-1サンプルデータ

サンプル数 場所 リビングエリア 価格(百万円)
1 10.06 60 302.86
2 15.47 74 393.04
3 18.66 46 270.67
4 5.20 77 450.59
... ... ... ...
  • 特性値1 - 場所は、統計が得られ:
    • 最大:21.96キロ
    • 最小:2.02キロ
    • 平均:12.13キロ
  • 固有値2 - 住宅エリアには、統計情報を取得します:
    • 最大:119平方メートル
    • 最小:40平方メートル
    • 平均:78.9メートル
  • タグ値 - 百万の価格、:
    • マックス:674.37
    • 最小:181.38
    • 平均:420.64

XYZ座標で実証表5-2に示すように、このデータは、三次元であり、ラベル値Zとして、xとyの2つの特徴値として使用することができます。

3次元空間の表5-2サンプルの可視化

前方に 側面

正の観点から、多くの芝生のように、飛行機のようです。再びデータに当てはめた直線のように、側面から見た、および第4章。したがって、このような三次元線形フィットのために、我々は、この平面は、このビットの「芝生」に位置する嵌合面として考えることができ、「芝生」は上部二分割し、薄い「芝生」を低いですので、最終的には全てのサンプル点とその平面の最小二乗距離という。

5.0.2多重線形回帰モデル

テーブルとして、私たちは予測問題を解決するために、1000のサンプル値に基づいてモデルを構築する必要があるので、正確にデータを15キロに沿った条件の93平方メートルないかもしれません。

例示のために、我々は、基本的な問題は、線形回帰の問題であり、2つ以上の独立変数を含む多重線形回帰、回帰すなわち典型的である識別することができます。多変量線形回帰関数モデル次のように:

\ [Y = A_0 + a_1x_1 + a_2x_2 + \ドット+ a_kx_k \]

予測問題の具体的な速度は、上記の式は、のように簡略化することができます。

\ [Z = X_1 \ CDOT W_1 + X_2 \ CDOT W_2 + B \]

場合さておき、本実施形態率の問題、一般的なアプリケーションの問題、多重線形回帰モデル、効果を説明し、予測する優れた能力を確保するために回帰モデルのために、第一の基準は独立変数を選択すべきです。

  1. 引数には、従属変数に大きな影響を持っている、と密接な線形相関を示した必要があります。
  2. 独立変数と従属変数間の線形相関は、正式ではない、本物でなければなりません。
  3. 相互に排他的な変数間から、すなわち独立変数間の相関関係が原因従属変数の引数の関連性を超えてはならない、特定の特性を有するべきです。
  4. 引数は完全な統計データを持っている必要があり、予測値を決定することは容易です。

5.0.3ソリューション

あなたはこの問題を解決するために、伝統的な数学的手法を使用している場合、我々は通常の方程式を使用することができ、数学的な解析解こうして得られ、その後、近似解を得るために、ニューラルネットワークのアプローチを使用して、2つの間の比較の精度ので、ニューラルネットワークの更なるデバッグパラメータ、学習の目的を達成します。

我々としても、読者の後、比較を行うと、コードを実行し、結果を取得するには、その後、表5-3に慎重に比較するアイテムを体験するためにここに戻ってくるためにここに二つの方法で入れたかもしれません。

二つの方法の比較表5-3

方法 正規方程式 勾配降下
原則 いくつかの行列演算 複数の反復
特別な要件 \(X ^ TX \)の逆が存在します あなたは学習率を決定する必要があります
複雑 \(O(n^3)\) \(O(n^2)\)
サンプルの適用数 \(M \ LT 10000 \) \(m \ge 10000\)

おすすめ

転載: www.cnblogs.com/woodyh5/p/12021704.html