1 pregunta
Dado x ∈ R n × 1 \mathbf{x} \in \mathbb{R}^{n \times 1}X∈Rn × 1,A ∈ R n × n \mathbf{A} \in \mathbb{R}^{n \times n}A∈Rn × n ,f ( x ) = ( A x ) ⊙ ( A x ) \mathbf{f}(\mathbf{x})=\sqrt{(\mathbf{x}) \odot(\ mathbf{Ax}) }f ( x )=( Ax ) _⊙( Ax ) _. donde ( ⋅ ) \sqrt{(\cdot)}( ⋅ )Representa la raíz de Hadamard (raíz cuadrada de elementos), es decir, la raíz cuadrada de los elementos de la matriz elemento por elemento. Encuentre ∂ f ∂ x \frac{\partial \mathbf{f}}{\partial \mathbf{x}}∂ x∂f _。
2 resolver
2.1 Primero use el producto de Hadamard para resolver la raíz cuadrada
Por ejemplo: b = A x \mathbf{b} = \mathbf{A} \mathbf{x}b=A x,有:db = d ( A x ) = A dxd\mathbf{b} = d(\mathbf{A} \mathbf{x}) = \mathbf{A} d\mathbf{x}reb _=d ( A x )=un d x
2.2 Derivación de matriz a matriz Generalmente, la matriz se vectoriza primero
f ⊙ f = ( A x ) ⊙ ( A x ) = b ⊙ b \begin{aligned} \mathbf{f} \odot \mathbf{f} &=(\mathbf{A} \mathbf{x}) \odot (\mathbf{A} \mathbf{x}) \\ &=\mathbf{b} \odot \mathbf{b} \end{aligned}F⊙F=( Ax ) _⊙( Ax ) _=b⊙segundo
Según la propiedad del producto diferencial de Hadamard : d ( x ⊙ Y ) = x ⊙ d Y + dx ⊙ Y d(\mathbf{x} \odot \mathbf{Y})=\mathbf{x} \odot d \mathbf {Y }+d \mathbf{x} \odot \mathbf{Y}re ( x⊙Sí )=X⊙d Y+d x⊙Y
有:
d ( f ⊙ f ) = f ⊙ df + df ⊙ f = f ⊙ df + f ⊙ df = 2 f ⊙ dfdiag ( f ) vec(df) = diag ( b ) vec(db) ( Sea : vec ( A ⊙ X ) = diag ( A ) vec ( X ) ) \begin{aligned} d(\mathbf{f} \odot \mathbf{f}) &=\mathbf{f} \ odot d \mathbf{f}+d \mathbf{f} \odot \mathbf{f} \\ &=\mathbf{f} \odot d \mathbf{f}+\mathbf{f} \odot d \mathbf { f} \\ &= 2\mathbf{f} \odot d \mathbf{f} \\ \operatorname{diag(\mathbf{f})\operatorname{vec(d\mathbf{f})}} &= \ nombre del operador{diag(\mathbf{b})\nombredeloperador{vec(d\mathbf{b})}} \quad (definición:\nombredeloperador{vec}(\mathbf{A} \odot \mathbf{X})= \ nombre del operador{diag}(\mathbf{A}) \nombredeloperador{vec}(\mathbf{X})) \end{aligned}re ( f⊙f )diag ( f ) _ _ _v e c ( d f )=F⊙d f+d f⊙F=F⊙d f+F⊙d f=2 f⊙d f=diag ( b ) _ _ _en mi c ( reb ) _( naturaleza :en mi c ( UN⊙X )=diag ( A ) _ _ _en mi c ( X ) ).
donde diag ( f ) \operatorname{diag}(\mathbf{f})d i a g ( f ) esn × nn \times nnorte×La matriz diagonal de n , los elementos en la diagonal son la matrizf \mathbf{f}f está organizado mediante vectorización de columnas;diag ( b ) \operatorname{diag}(\mathbf{b})d i a g ( b ) es el mismo.
vec(df) = diag(f) − 1 diag ( b ) vec ( db ) \operatorname{vec(d\mathbf{f})} = \operatorname{diag(\mathbf{f})}^ {-1} \operatorname{diag}(\mathbf{b}) \operatorname{vec}(d\mathbf{b})v mi c ( d f )=diag ( f ) _ _ _− 1diag ( b ) _ _ _en mi c ( reb ) _
b ∈ R n × 1 ⟹ vec(db) = db \mathbf{b} \in \mathbb{R}^{n\times 1} implica \operatorname{vec(d\mathbf{b})} = d \ matemáticasbf{b}b∈Rnorte × 1⟹en mi c ( reb ) _=reb _
∴ diag(f) df = diag(b) A dx \por lo tanto \operatorname{diag(\mathbf{f})} d \mathbf{f} = \operatorname{diag(b)} \mathbf{A} d \mathbf{x}∴diag ( f ) _ _ _d f=diag ( b ) _ _ _un d x
vec(df) = diag(f) − 1 diag(b) A dx \operatorname{vec(d\mathbf{f})} = \operatorname{diag(\mathbf{f})}^{-1 } \operatorname{diag(\mathbf{b})} \mathbf{A} d \mathbf{x}v mi c ( d f )=diag ( f ) _ _ _− 1diag ( b ) _ _ _un d x
Derivación de matriz a matriz si se utiliza el diseño del denominador:
vec ( df ) = ( ∂ f ∂ x ) T vec ( dx ) \operatorname{vec}(d \mathbf{f})=\left(\frac { \partial \mathbf{f}}{\partial \mathbf{x}}\right)^{T} \operatorname{vec}(d \mathbf{x})v mi c ( d f )=(∂ x∂f _)tSi v e c ( d x )
adopta un diseño molecular, existen:
vec ( df ) = ( ∂ f ∂ x ) vec ( dx ) \operatorname{vec}(d \mathbf{f})=\left(\ frac{\partial \mathbf{f}}{\partial \mathbf{x}}\right) \operatorname{vec}(d \mathbf{x})v mi c ( d f )=(∂ x∂f _)v mi c ( d x )
Entonces, para este problema, si se usa la disposición del denominador:
∂ f ∂ x = ( diag(f) − 1 diag(b) A ) T \frac{\partial \mathbf{f}}{\partial \mathbf {x }} = \left(\operatorname{diag(\mathbf{f})}^{-1} \operatorname{diag(\mathbf{b})} \mathbf{A}\right)^{T}∂ x∂f _=( diag ( f ) _ _ _− 1diag ( b ) _ _ _Un )Si T
adopta un diseño molecular:
∂ f ∂ x = diag(f) − 1 diag(b) A \frac{\partial \mathbf{f}}{\partial \mathbf{x}} = \operatorname{diag( \mathbf{f})}^{-1} \operatorname{diag(\mathbf{b})} \mathbf{A}∂ x∂f _=diag ( f ) _ _ _− 1diag ( b ) _ _ _A