具体的な詳細については、後の記事で説明します。不平を言ってはいけません。
序文
Numpyチュートリアルについては、次のリンクを参照してください:[リンク](https://blog.csdn.net/Twilightzsj/article/details/115332925)。1.ライブラリをインポートします
import numpy as np #矩阵运算
import matplotlib.pyplot as plt #可视化
import random #产生数据扰动
2.データを生成する
近似曲線y = 2×x2 + x + 1 y = 2 \ times x ^ {2} + x + 1そして=2××バツ2+バツ+1
X_m = np.mat([[i**2, i, 1] for i in range(-10,10)]) #矩阵类型,用于运算
y_m = np.mat([[2*x[0,0]+x[0,1]+1+random.normalvariate(0,1)] for x in X_m]) #矩阵类型,用于运算
X_a = np.asarray(X_m[:,1].T)[0] #array类型,用于可视化
y_a = np.asarray(y_m.T)[0] #array类型,用于可视化
plt.scatter(X_a, y_a) #显示数据
plt.show()
3. BGD
def BGD(X,y,w0,step,e): #批量梯度下降法
n=0
while n<=10000:
w1 = w0-step*X.T.dot(X.dot(w0)-y)/X.shape[0]
dw = w1-w0;
if dw.dot(dw.T)[0,0] <= e**2:
return w1
n += 1
w0 = w1
return w1
4.計算
w_m = BGD(X_m,y_m,np.mat([[5],[3],[2]]),1e-4,1e-20) #可自行调参
w_a = np.asarray(w_m.T)[0]
print(w_a)
配列([1.99458492、0.91587829、1.48498921])
5.評価(R 2 R ^ {2}R2)
y_mean = y_a.mean()
y_pre = np.array([w_a[0]*x[0,0]+w_a[1]*x[0,1]+w_a[2] for x in X_m])
SSR = ((y_pre-y_mean)**2).sum()
SST = ((y_a-y_mean)**2).sum()
R2 = SSR/SST
print(R2)
0.9845542903194531
フィッティング効果は良いと思います。もしR 2 R ^ {2}R2の値は0に近いため、再度調整する必要がある場合があります。
6.結果表示
X = np.linspace(-10,10,50)
y = np.array([w_a[0]*x**2+w_a[1]*x+w_a[2] for x in X])
plt.scatter(X_a,y_a)
plt.plot(X,y)
plt.show()