Caso de derivación de productos Hadamard

1 pregunta

Dado x ∈ R n × 1 \mathbf{x} \in \mathbb{R}^{n \times 1}XRn × 1A ∈ R n × n \mathbf{A} \in \mathbb{R}^{n \times n}ARn × n ,f ( x ) = ( A x ) ⊙ ( A x ) \mathbf{f}(\mathbf{x})=\sqrt{(\mathbf{x}) \odot(\ mathbf{Ax}) }f ( x )=( Ax ) _( Ax ) _ . donde ( ⋅ ) \sqrt{(\cdot)}( ) Representa la raíz de Hadamard (raíz cuadrada de elementos), es decir, la raíz cuadrada de los elementos de la matriz elemento por elemento. Encuentre ∂ f ∂ x \frac{\partial \mathbf{f}}{\partial \mathbf{x}}x∂f _


2 resolver

2.1 Primero use el producto de Hadamard para resolver la raíz cuadrada

Por ejemplo: b = A x \mathbf{b} = \mathbf{A} \mathbf{x}b=A x,有:db = d ( A x ) = A dxd\mathbf{b} = d(\mathbf{A} \mathbf{x}) = \mathbf{A} d\mathbf{x}reb _=d ( A x )=un d x

2.2 Derivación de matriz a matriz Generalmente, la matriz se vectoriza primero

f ⊙ f = ( A x ) ⊙ ( A x ) = b ⊙ b \begin{aligned} \mathbf{f} \odot \mathbf{f} &=(\mathbf{A} \mathbf{x}) \odot (\mathbf{A} \mathbf{x}) \\ &=\mathbf{b} \odot \mathbf{b} \end{aligned}FF=( Ax ) _( Ax ) _=bsegundo

Según la propiedad del producto diferencial de Hadamard : d ( x ⊙ Y ) = x ⊙ d Y + dx ⊙ Y d(\mathbf{x} \odot \mathbf{Y})=\mathbf{x} \odot d \mathbf {Y }+d \mathbf{x} \odot \mathbf{Y}re ( x )=Xd Y+d xY
有:
d ( f ⊙ f ) = f ⊙ df + df ⊙ f = f ⊙ df + f ⊙ df = 2 f ⊙ dfdiag ( f ) vec(df) ⁡ ⁡ = diag ( b ) vec(db) ⁡ ⁡ ( Sea : vec ⁡ ( A ⊙ X ) = diag ⁡ ( A ) vec ⁡ ( X ) ) \begin{aligned} d(\mathbf{f} \odot \mathbf{f}) &=\mathbf{f} \ odot d \mathbf{f}+d \mathbf{f} \odot \mathbf{f} \\ &=\mathbf{f} \odot d \mathbf{f}+\mathbf{f} \odot d \mathbf { f} \\ &= 2\mathbf{f} \odot d \mathbf{f} \\ \operatorname{diag(\mathbf{f})\operatorname{vec(d\mathbf{f})}} &= \ nombre del operador{diag(\mathbf{b})\nombredeloperador{vec(d\mathbf{b})}} \quad (definición:\nombredeloperador{vec}(\mathbf{A} \odot \mathbf{X})= \ nombre del operador{diag}(\mathbf{A}) \nombredeloperador{vec}(\mathbf{X})) \end{aligned}re ( ff )diag ( f ) _ _ _v e c ( d f )=Fd f+d fF=Fd f+Fd f=2 fd f=diag ( b ) _ _ _en mi c ( reb ) _( naturaleza :en mi c ( UNX )=diag ( A ) _ _ _en mi c ( X ) ).
donde diag ⁡ ( f ) \operatorname{diag}(\mathbf{f})d i a g ( f ) esn × nn \times nnorte×La matriz diagonal de n , los elementos en la diagonal son la matrizf \mathbf{f}f está organizado mediante vectorización de columnas;diag ⁡ ( b ) \operatorname{diag}(\mathbf{b})d i a g ( b ) es el mismo.

vec(df) ⁡ = diag(f) ⁡ − 1 diag ⁡ ( b ) vec ⁡ ( db ) \operatorname{vec(d\mathbf{f})} = \operatorname{diag(\mathbf{f})}^ {-1} \operatorname{diag}(\mathbf{b}) \operatorname{vec}(d\mathbf{b})v mi c ( d f )=diag ( f ) _ _ _1diag ( b ) _ _ _en mi c ( reb ) _

b ∈ R n × 1 ⟹ vec(db) ⁡ = db \mathbf{b} \in \mathbb{R}^{n\times 1} implica \operatorname{vec(d\mathbf{b})} = d \ matemáticasbf{b}bRnorte × 1en mi c ( reb ) _=reb _

∴ diag(f) ⁡ df = diag(b) ⁡ A dx \por lo tanto \operatorname{diag(\mathbf{f})} d \mathbf{f} = \operatorname{diag(b)} \mathbf{A} d \mathbf{x}diag ( f ) _ _ _d f=diag ( b ) _ _ _un d x

vec(df) ⁡ = diag(f) ⁡ − 1 diag(b) ⁡ A dx \operatorname{vec(d\mathbf{f})} = \operatorname{diag(\mathbf{f})}^{-1 } \operatorname{diag(\mathbf{b})} \mathbf{A} d \mathbf{x}v mi c ( d f )=diag ( f ) _ _ _1diag ( b ) _ _ _un d x

Derivación de matriz a matriz si se utiliza el diseño del denominador:
vec ⁡ ( df ) = ( ∂ f ∂ x ) T vec ⁡ ( dx ) \operatorname{vec}(d \mathbf{f})=\left(\frac { \partial \mathbf{f}}{\partial \mathbf{x}}\right)^{T} \operatorname{vec}(d \mathbf{x})v mi c ( d f )=(x∂f _)tSi v e c ( d x )
adopta un diseño molecular, existen:
vec ⁡ ( df ) = ( ∂ f ∂ x ) vec ⁡ ( dx ) \operatorname{vec}(d \mathbf{f})=\left(\ frac{\partial \mathbf{f}}{\partial \mathbf{x}}\right) \operatorname{vec}(d \mathbf{x})v mi c ( d f )=(x∂f _)v mi c ( d x )

Entonces, para este problema, si se usa la disposición del denominador:
∂ f ∂ x = ( diag(f) ⁡ − 1 diag(b) ⁡ A ) T \frac{\partial \mathbf{f}}{\partial \mathbf {x }} = \left(\operatorname{diag(\mathbf{f})}^{-1} \operatorname{diag(\mathbf{b})} \mathbf{A}\right)^{T}x∂f _=( diag ( f ) _ _ _1diag ( b ) _ _ _Un )Si T
adopta un diseño molecular:
∂ f ∂ x = diag(f) ⁡ − 1 diag(b) ⁡ A \frac{\partial \mathbf{f}}{\partial \mathbf{x}} = \operatorname{diag( \mathbf{f})}^{-1} \operatorname{diag(\mathbf{b})} \mathbf{A}x∂f _=diag ( f ) _ _ _1diag ( b ) _ _ _A

Supongo que te gusta

Origin blog.csdn.net/lyh458/article/details/121963469
Recomendado
Clasificación