Hay relativamente pocos casos de derivación de matrices que incluyan la raíz de Hadamard; este caso es solo como referencia:
1 tema
Dado X ∈ R n \mathbf{X} \in \mathbb{R}^{n}X∈Rnorte ,A ∈ R norte × n \mathbf{A} \in \mathbb{R}^{n \times n}A∈Rn × n ,f ( X ) = ∑ i = 1 n ∣ AX ∣ i 2 + δ 2 f(\mathbf{X})=\sum_{i=\mathbf{1}}^{n} \sqrt{| \mathbf{A} \mathbf{X}|_{i}^{2}+\delta^{2}}f ( X )=∑yo = 1norte∣AX∣ _ _ _i2+d2. donde ( ⋅ ) \sqrt{(\cdot)}( ⋅ )Representa la raíz de Hadamard (raíz cuadrada de elementos), es decir, la raíz cuadrada de los elementos de la matriz elemento por elemento. Encuentra f ′ ( X ) f^{\prime}(\mathbf{X})F′ (X),即∂ f ∂ X \frac{\partial f}{\partial \mathbf{X}}∂X _∂f _。
2 resolver
2.1 Primero use el producto de Hadamard para resolver la raíz cuadrada
令v = ∣ AX ∣ 2 + δ 2 1 \mathbf{v}=\sqrt{|\mathbf{A} \mathbf{X}|^{2}+\delta^{2}\mathbf{1}}v=∣AX∣ _ _ _2+d2 1
∴ v ⊙ v = ∣ AX ∣ 2 + δ 2 1 = AX ⊙ AX + δ 2 1 \begin{aligned} \thefore \quad \mathbf{v} \odot \mathbf{v} &=|\mathbf{A} ; \mathbf{X}|^{2}+\delta^{2} \mathbf{1}\\ &=\mathbf{A} \mathbf{X} \odot \mathbf{A} \mathbf{X}+ \ delta^{2}\mathbf{1}\end{alineado}∴v⊙v=∣AX∣ _ _ _2+d2 1=una x⊙una x+d2 1
Según la propiedad del producto diferencial de Hadamard : d ( X ⊙ Y ) = X ⊙ d Y + d X ⊙ Y d(\mathbf{X} \odot \mathbf{Y})=\mathbf{X} \odot d \ mathbf{ Y}+d \mathbf{X} \odot \mathbf{Y}re ( X⊙Sí )=X⊙d Y+dx _⊙Y :
d ( v ⊙ v ) = v ⊙ dv + dv ⊙ v = v ⊙ dv + v ⊙ dv = 2 v ⊙ dv \begin{aligned} d(\mathbf{v} \odot \mathbf{v}) &=\mathbf{v} \odot d \mathbf{v}+d \mathbf{v} \odot \mathbf{v} \\ &=\mathbf{v} \odot d \mathbf{v}+\mathbf{ v} \odot d \mathbf{v} \\ &= 2\mathbf{v} \odot d \mathbf{v} \end{aligned}re ( v)⊙v )=v⊙dv _+dv _⊙v=v⊙dv _+v⊙dv _=2v_ _⊙dv _
即:
2 v ⊙ dv = d ( AX ⊙ AX + δ 2 1 ) = d ( AX ⊙ AX ) + d ( δ 2 1 ) = 2 AX ⊙ d ( AX ) = 2 AX ⊙ ( ( d A ) X + A d X ) = 2 AX ⊙ A d X \begin{aligned} 2 \mathbf{v} \odot d \mathbf{v} &=d\left(\mathbf{A} \mathbf{X} \odot \mathbf {A} \mathbf{X}+\delta^{2} \mathbf{1}\right) \\ &=d(\mathbf{A} \mathbf{X} \odot \mathbf{A} \mathbf{X })+d(\delta^{2}\mathbf{1})\\&=2\mathbf{A}\mathbf{X}\odot d(\mathbf{A}\mathbf{X})\\& =2 \mathbf{A} \mathbf{X} \odot((d \mathbf{A}) \mathbf{X}+\mathbf{A} d \mathbf{X}) \\ &=2 \mathbf{A } \mathbf{X} \odot \mathbf{A} d \mathbf{X} \end{alineado}2v_ _⊙dv _=d( Una X⊙una x+d2 1)=re ( A X⊙AX ) _+re ( re2 1)=2 AX _⊙re ( A X )=2 AX _⊙( ( d A ) X+A y X )=2 AX _⊙A d X
∴ dv = AX ⊙ A d X ⊘ v \por lo tanto \quad d \mathbf{v}=\mathbf{A} \mathbf{X} \odot \mathbf{A} d \mathbf{X} \oslash \mathbf{v } }∴dv _=una x⊙Un anuncio X⊘v
donde⊘ \oslash⊘ es división de Hadamard/división por elementos, es decir, división por elementos de matriz, y⊙ \odot⊙ tienen propiedades similares. O seap ⊙ v = 1 \mathbf{p} \odot \mathbf{v} = \mathbf{1}pag⊙v=1,即p \mathbf{p}p esv \mathbf{v}vPor la inversa de Hadamard / inversa de elementos, ecuacióndv = AX ⊙ A d X ⊙ pd \mathbf{v}=\mathbf{A} \mathbf{X} \odot \mathbf{A} d \mathbf{X} \odot \mathbf{p}dv _=una x⊙Un anuncio X⊙pág .
2.2 Utilizando las propiedades del producto interno de Frobenius (producto interno de la matriz) y la traza, se puede obtener la solución
Dé el producto interno de Frobenius : A : B = tr ( ATB ) \mathbf{A}:\mathbf{B} = \operatorname{tr}(\mathbf{A}^{T}\mathbf{B})A:B=t r ( AT B), puede obtener:
f = 1 : v ∴ df = d ( 1 : v ) = d 1 : v + 1 : dv ( valor : ∇ ( A : B ) = ∇ A : B + A : ∇ B ) = 1 : dv = : ( AX ⊙ A d X ⊘ v ) = 1 : ( AX ⊘ v ⊙ A d X ) ( Encontrar : X ⊙ Y = Y ⊘ v ) = ( 1 ⊙ ( AX ⊘ v ) ) : ( A d X ) ( Forma : C : ( A ⊙ B ) = ( C ⊙ A ) : B ) = ( AX ⊘ v ) : ( A d X ) = AT ( AX ⊘ v ) : d X ( Forma : CA : B = A : CTB = C : BAT = tr ( ( AT ( AX ⊘ v ) ) T d X ) ( libre e independiente ) 即 ∂ f ∂ X = AT ( AX ⊘ v ) ( Definido : df = tr ( ( ∂ f ∂ X ) T d X ) ) \begin{aligned} f &=\mathbf{1}: \mathbf{v} \\ \por lo tanto \quad df &= d(\mathbf{1}: \ mathbf{v}) \\ &= d\mathbf{1}:\mathbf{v} + \mathbf{1}:d\mathbf{v}\quad (definición: \nabla(\mathbf{A}: \mathbf {B})=\nabla \mathbf {A}: \mathbf{B}+\mathbf{A}: \nabla \mathbf{B}) \\ &=\mathbf{1}: d \mathbf{v}\ \&=\mathbf{1}:(\mathbf{A} \mathbf{X} \odot \mathbf{A} d \mathbf{X} \oslash \mathbf{v}) \\ &=\mathbf{1}:(\mathbf{A} \mathbf {X} \oslash \mathbf{v} \odot \mathbf{A} d \mathbf{X} ) \quad ( propiedad: \mathbf{X} \odot \mathbf{Y} = \mathbf{Y} \odot \ mathbf{X}) \\ &=(\mathbf{1}\odot(\mathbf{A} \mathbf{X} \oslash \mathbf{v})) : (\mathbf{A} d \mathbf{X} ) \quad ( propiedad: \mathbf{C}:(\mathbf{A} \odot \mathbf{B}) = (\mathbf{C} \odot \mathbf{A}):\mathbf{B})\\ &=(\mathbf{A} \mathbf{X} \oslash \mathbf{v}):(\mathbf{A} d \mathbf{X}) \\ &=\mathbf{A}^{T}(\ mathbf{A} \mathbf{X} \oslash \mathbf{v}): d \mathbf{X} \quad ( propiedad: \mathbf{C} \mathbf{A} : \mathbf{B} = \mathbf{A } : \mathbf{C}^T\mathbf{B} = \mathbf{C} :\mathbf{B} \mathbf{A}^T \\ &=\operatorname{tr}((\mathbf{A}^T (\mathbf{A} \mathbf{X} \oslash \mathbf{v})) ^T d \mathbf{X})\quad (fracción libre)\\ in \quad \frac{\partial f}{\partial \mathbf{X}} &=\mathbf{A}^{T}( \mathbf {A} \mathbf{X} \oslash \mathbf{v}) \quad (definición: df=\operatorname{tr}\left(\left(\frac{\partial f}{\partial \mathbf{X }} \right)^{T}d\mathbf{X}\right))\end{aligned}F∴d fAhora mismo∂X _∂f _=1:v=re ( 1:v )=re 1:v+1:dv _( naturaleza:∇ ( A:B )=∇Un _:B+A:∇ B )=1:dv _=1:( Una X⊙Un anuncio X⊘v )=1:( Una X⊘v⊙A y X )( naturaleza:X⊙Y=Y⊙X )=( 1⊙( Una X⊘v ) ):( A y X )( naturaleza:C:( Un⊙B )=( C⊙Un ):B )=( Una X⊘v ):( A y X )=AT (AX⊘v ):dx _( naturaleza:C A:B=A:CTB _=C:B At=t r ( ( AT (AX⊘v ) )T dX)( Definición de producto interno de la matriz )=AT (AX⊘v )( propiedades : d f=t r( (∂X _∂f _)tdX ) ) _
Si se utiliza la inversa de Hadamard definida anteriormente, el resultado también se puede expresar como:
∂ f ∂ X = AT ( AX ⊙ p ) \frac{\partial f}{\partial \mathbf{X}} =\mathbf{A} ^ {T}(\mathbf{A} \mathbf{X} \odot \mathbf{p})∂X _∂f _=AT (AX⊙pag )
Resumen:
primero use el producto de Hadamard para resolver la raíz cuadrada y luego use las propiedades de correlación para obtener dvd\mathbf{v}d v y finalmente use las propiedades del producto interno de la matriz y trace para obtener la solución.
Link de referencia: