ネルダー・ミード アルゴリズムは、多変量関数の極小値を求めるアルゴリズムであり、関数の導関数を必要とせず、迅速に極小値に収束することが利点です。
アルゴリズムは関数の引数空間に初期点 x1 を提供する必要があり、アルゴリズムはこの点から開始して極小値を見つけます。
ダウンヒルシンプレックス法としても知られるネルダー・ミード法は、1965 年にジョン・ネルダーとロジャー・ミードによって提案された数値最適化問題を解決するためのヒューリスティック検索です。
n+1 個の頂点(i=1,2...,n+1) がある場合、これらの点に対応する関数値は次のようになります。
特定の精度条件またはループ数が満たされたときにループが終了するまで、次のアルゴリズム ステップの実行を開始します。
1. 目的関数の値に従って、n+1 点を良い点から悪い点まで並べ替え、最悪の点、2 番目に悪い点、および最良の点を決定します。
2. 最悪点を除く他の点の中心点を計算します。
3. 反射操作、反射点を計算します(つまり、最悪の点、C は 2 番目のステップで計算された中心点であり、反射係数であり、1 に等しい)
3.1 If (反射点の結果が最良の点と 2 番目に悪い点の間にあることを意味する) 順序付け(つまり、最悪の点を削除) し、ループの次の層に入ります。
3.2 (反射点の結果が最良点よりも優れていることを意味する) 場合、拡張点を計算します。
3.2.1 If (拡張ポイントによって得られた結果が反映ポイントよりも優れていることを意味する)、 make 、ループの次の層に入る
3.2.2 それ以外の場合(拡張失敗の意味)、次のサイクルに入る
3.3 このとき(反射点の結果が最悪点と二番目に悪い点の間で、最悪点よりも良いことを意味する)、外向き圧縮演算が行われ、計算
3.3.1 If (外側の圧縮点が反射点よりも優れていることを意味する)、let (最悪の点を置き換え)、ループの次の層に入る
3.3.2 それ以外の場合は、最後のステップを実行します
3.4 もし(反射点の結果が最悪の点より悪いという意味で)この時点で内向きの圧縮操作を実行し、
3.4.1 If 、 order 、そして次のサイクルに入る
3.4.2 それ以外の場合は次のサイクルに入る
3.5 上記の 4 つの条件が満たされない場合は、(i=2,...n+1) を設定し、ループの次の層に割り当てて開始します。
例としてバイナリ関数を取り上げ、Python プログラミングを使用してみましょう
与えられた初期点: [0,0]、[1.2,0]、[0,0.8]
def func(x1, x2):
return x1 * x1 - 4 * x1 + x2 * x2 - x2 - x1 * x2
# 创建一个简单的二维数组
x = [[0, 0, 0], [1.2, 0, 0], [0, 0.8, 0]]
n = len(x)
m=0
for m in range(20):
# 第一步,将这些点按照从小到大排序
# 计算每个点对应的函数值
for i in range(n):
x[i][2] = func(x[i][0], x[i][1])
# 按照目标函数值进行排序---从小到大排序
for i in range(n - 1):
for j in range(n - 1):
if x[j][2] > x[j + 1][2]:
temp = x[j]
x[j] = x[j + 1]
x[j + 1] = temp
print("第{}次循环得到的最优值为:".format(m),x[0])
# 第二步,计算除去最坏点的其他点的中心点
c = [0, 0, 0] # 进行一个初始化
c[0] = (x[0][0] + x[1][0]) / 2
c[1] = (x[0][1] + x[1][1]) / 2
c[2] = func(c[0], c[1])
# 第三步进行反射操作,计算反射点
xr = [0, 0, 0]
xr[0] = 2 * c[0] - x[2][0]
xr[1] = 2 * c[1] - x[2][1]
xr[2] = func(xr[0], xr[1])
if x[0][2] <= xr[2] < x[1][2]:
x[2] = xr
continue
elif xr[2] < x[0][2]:
xe = [0, 0, 0]
xe[0] = 3 * c[0] - 2 * x[2][0]
xe[1] = 3 * c[1] - 2 * x[2][1]
xe[2] = func(xe[0], xe[1])
if xe[2] < xr[2]:
x[2] = xe
continue
else:
x[2] = xr
continue
elif x[1][2] <= xr[2] < x[2][2]:
c1 = [0, 0, 0]
c1[0] = c[0] + (xr[0] - c[0]) / 2
c1[1] = c[1] + (xr[1] - c[1]) / 2
c1[2] = func(c1[0], c1[1])
if c1[2] < xr[2]:
x[2] = c1
continue
else:
pass
elif x[2][2] <= xr[2]:
c2 = [0, 0, 0]
c2[0] = c[0] + (x[2][0] - c[0])
c2[1] = c[1] + (x[2][1] - c[1])
c2[2]=func(c2[0],c2[1])
if c2[2]<x[2][2]:
x[2]=c2
continue
else:
pass
i=1
for i in range(n):
x[i][0]=x[0][0]+(x[i][0]-x[0][0])/2
x[i][1] = x[0][1] + (x[i][1] - x[0][1]) / 2
x[i][2]=func(x[i][0],x[i][1])
continue
実行結果を次の図に示します。