迭代法(逐次逼近法)
在线性代数中我们常看到方程组被写为这样的形式:
Ax=b
其中A是非奇异矩阵(行列式不等于0)。本科阶段,我们求解的方程组阶数都不高,一般使用主元消去法求解。但对于A的阶数很大,而且零元素很多的大型稀疏矩阵方程组,例如,训练一个包含几十MB乃至几百MB的数据集时,主元消去法就显得力不从心了,而一般要选用逐次逼近法(或称为迭代法)求解。
为了便于说明,下面我们举一个求解线性方程组的迭代法例子。
⎩⎨⎧8x1−3x2+2x3=204x1+11x2−x3=336x1+3x2+12x3=36
如果记为Ax=b,其中:
A=⎣⎡846−31132−112⎦⎤x=⎣⎡x1x2x3⎦⎤b=⎣⎡203336⎦⎤
方程组的精确解是:
x∗=(3,2,1)T
如果记为另一种形式:
⎩⎪⎪⎨⎪⎪⎧x=B0x+fx1=81(3x2−2x3+20)x2=111(−4x1+x3+33)x3=121(−6x1−3x2+36)
转换为矩阵的形式:
B0=⎣⎡011−412−683012−38−21110⎦⎤f=⎣⎡82011331236⎦⎤
任取初始值,例如取
x(0)=(0,0,0)T。将这些值代入公式(5)右边,即求得方程组的第一次迭代方程组的解,得到新的值。
x(1)=(x1(1),x2(1),x3(1))T=(2.5,3,3)T
再将
x(1)的分量代入公式(5)右边得到
x(2)。反复利用这个计算程序,得到一个向量序列和一般的计算公式(迭代公式)简写为:
x(k+1)=B0x(k)+f
其中k为迭代次数(k=0,1,2,…)。
迭代10次之后得到:
x(10)=(3.000032,1.999838,0.9998813)T
误差向量范数:
∥∥∥ε(10)∥∥∥∞=0.000187(ε(10)=x(10)−x∗)
代码实现:
import numpy as np
from numpy import linalg
import matplotlib.pyplot as plt
A = np.mat([[8,-3,2],[4,11,-1],[6,3,12]])
b = np.mat([20,33,36])
result = linalg.solve(A,b.T)
print(result)
B0 = np.mat([[0,3/8,-2/8],[-4/11,0,1/11],[-6/12,-3/12,0]])
f = np.mat([20/8,3,3])
error = 1.0e-10
steps = 100
xk = np.zeros((3,1))
errorlist = []
for k in range(steps):
xk_1 = xk
xk = B0*xk+f.T
errorlist.append(linalg.norm(xk-xk_1))
if errorlist[-1] < error:
print(k+1)
break
print(xk)
plt.plot(range(1,26),errorlist,'o')
plt.show()
输出:
[[3.]
[2.]
[1.]]
25
[[3.]
[2.]
[1.]]
摘自:《机器学习原理与算法实践》