万能逼近原理(证明)

本文翻译自1989年一篇论文,证明了只有一个隐层的前馈神经网络可以逼近任何连续函数。
单隐层单输出神经网络结构记为:
G ( x ) = ∑ i = 1 N α i σ ( y i T x + θ i ) G\left( x \right) = \sum\limits_{i = 1}^N { {\alpha _i}\sigma \left( {y_i^Tx + {\theta _i}} \right)} G(x)=i=1Nαiσ(yiTx+θi)
其中 α i , y i T , θ i \alpha_i,{y_i^T},\theta_i αi,yiT,θi
都是参数, σ \sigma σ
且dim(x)=n
是单变量函数,满足一定条件时,G(x)在R^n->R的连续函数空间中稠密
具体的条件定义为:
在这里插入图片描述
也即若对于某个测度
μ ( x ) \mu(x) μ(x)
任意的 y ∈ R n , θ ∈ R y \in {R^n},\theta \in R yRn,θR
都有这个积分为0则称这个函数 σ \sigma σ
是discriminatory的
之后很大篇幅都在说满足这个性质的函数是什么:只要有界且满足取无穷时的极限是:
在这里插入图片描述
的连续函数即可。
在证明这个定理时利用了泛函分析三大定理之一的保范延拓定理
里斯表示定理
在这里插入图片描述
也就是设S为Theorem 1中的(2)张成的函数空间,则S必然包含在C(In)内,也即n为输入空间到一维的连续函数空间,现断言S的闭包R包含C(In),否则R是C(ln)的闭子空间,由保范延拓定理的推论,存在C(In)上线性有界泛函L,且L不是0泛函,使得L(R)=L(S)=0
这个定理实际上是推论:(夏道行《实变函数与泛函分析》)
在这里插入图片描述
因此这个非零的泛函L是存在的。
根据Riesz表示定理,任意C(In)上的函数h(x)的泛函为:
L ( h ) = ∫ I n h ( x ) d μ ( x ) L\left( h \right) = \int\limits_{ {I_n}} {h\left( x \right)} d\mu \left( x \right) L(h)=Inh(x)dμ(x)
注意该 μ ( x ) \mu(x) μ(x)
只与L有关是广义测度函数
在这里插入图片描述
因此根据L(S)=0得知,任意的y,\theta都成立:
∫ I n σ ( y T x + θ ) d μ ( x ) = 0 \int\limits_{ {I_n}} {\sigma \left( { {y^T}x + \theta } \right)} d\mu \left( x \right) = 0 Inσ(yTx+θ)dμ(x)=0
因此利用discriminatory的性质得到L是0泛函,这与L非零矛盾,因此S在C(In)中稠密。
证明的过程中需注意:这里S是在范数为极大范数(本性上界)上的线性赋范空间,否则R不一定在连续函数空间上。
这里补充证明一下:
若S中一列函数(依范数)
F n ( x ) → F ( x ) {F_n}\left( x \right) \to F\left( x \right) Fn(x)F(x)
若记:
Δ F n = F n ( x ) − F n ( x 0 ) \Delta {F_n} = {F_n}\left( x \right) - {F_n}\left( { {x_0}} \right) ΔFn=Fn(x)Fn(x0)
∣ Δ F ∣ ≤ ∣ Δ F − Δ F n ∣ + ∣ Δ F n ∣ \left| {\Delta F} \right| \le \left| {\Delta F - \Delta F_n} \right| + \left| {\Delta F_n} \right| ΔFΔFΔFn+ΔFn
不等号右边第二项可以利用有限项截断,第一项直接利用依范数收敛即可证明F(x)连续,也即R是闭空间。

Guess you like

Origin blog.csdn.net/undergraduate_/article/details/122246081