矩阵论结论

王品超上一道关于矩阵不等式的证明及其推广

1.设$A$为2阶正定矩阵,$0<\left|\overrightarrow\alpha\right|\leq1$,则有$$\frac{\left(\alpha^TA\alpha\right)\left(\alpha^TA^{‐1}\alpha\right)}{\alpha^T\alpha}\leq\frac{\displaystyle\left(\lambda_1+\lambda_2\right)^2}{4\lambda_1\lambda_2},其中\lambda_1 , \lambda_2是A特征值$$

证明:由条件知,存在正交矩阵$T$使$T^TAT=\begin{pmatrix}\lambda_1&0\\0&\lambda_2\end{pmatrix},\;\;\;\;\;\;\lambda_i>0,i=1,2$
令$T^T\alpha=\begin{pmatrix}y_1\\y_2\end{pmatrix}$,则$$\begin{array}{l}\frac{\left(\alpha^TA\alpha\right)\left(\alpha^TA^{‐1}\alpha\right)}{\alpha^T\alpha}=\frac{(\lambda_1y_1^2+\lambda_2y_2^2)(\lambda_1^{‐1}y_1^2+\lambda_2^{‐1}y_2^2)}{y_1^2+y_2^2}=\frac{y_1^4+y_2^4+\left(\frac{\lambda_2}{\lambda_1}+\frac{\lambda_1}{\lambda_2}\right)y_1^2y_2^2}{y_1^2+y_2^2}=\frac{(y_1^2+y_2^2)^2-2y_1^2y_2^2+\left(\frac{\lambda_2}{\lambda_1}+\frac{\lambda_1}{\lambda_2}\right)y_1^2y_2^2}{y_1^2+y_2^2}\\=y_1^2+y_2^2+\frac{\left(\sqrt{\frac{\lambda_2}{\lambda_1}}-\sqrt{\frac{\lambda_1}{\lambda_2}}\right)^2y_1^2y_2^2}{y_1^2+y_2^2}=(y_1^2+y_2^2)\left[1+\frac{\left(\sqrt{\frac{\lambda_2}{\lambda_1}}-\sqrt{\frac{\lambda_1}{\lambda_2}}\right)^2y_1^2y_2^2}{(y_1^2+y_2^2)^2}\right]\leq1+\frac{\left(\sqrt{\frac{\lambda_2}{\lambda_1}}-\sqrt{\frac{\lambda_1}{\lambda_2}}\right)^2y_1^2y_2^2}{(y_1^2+y_2^2)^2}\end{array}$$
因为$y_1^2+y_2^2\geq2\vert y_1y_2\vert,故\frac12\geq\frac{\vert y_1y_2\vert}{y_1^2+y_2^2},即\frac14\geq\frac{y_1^2y_2^2}{(y_1^2+y_2^2)^2}$,$$\Rightarrow \frac{\left(\alpha^TA\alpha\right)\left(\alpha^TA^{‐1}\alpha\right)}{\alpha^T\alpha}\leq1+\frac14\left(\sqrt{\frac{\lambda_2}{\lambda_1}}-\sqrt{\frac{\lambda_1}{\lambda_2}}\right)^2=\frac{\displaystyle\left(\lambda_1+\lambda_2\right)^2}{4\lambda_1\lambda_2}$$
更进一步,可以得到更强的不等式
2.设$A$为$n(n\geq 2)$阶正定矩阵,$0<\left|\overrightarrow\alpha\right|\leq1$,则有$$\frac{\left(\alpha^TA\alpha\right)\left(\alpha^TA^{‐1}\alpha\right)}{\alpha^T\alpha}\leq\frac{\displaystyle(n-1)\left(\lambda_1+\lambda_2\right)^2}{2n\lambda_1\lambda_2},其中\lambda_1 , \lambda_2分别是A最小及最大特征值$$
证明:由条件知,存在正交矩阵$T$使$T^TAT=\begin{pmatrix}\lambda_1&&0\\&\ddots&\\0&&\lambda_m\end{pmatrix},\;\lambda_i>0,i=1,2,\cdots,n$,不妨设$\lambda_1\leq\lambda_2\leq\cdots\leq\lambda_n$。
令$T^T\alpha=\begin{pmatrix}y_1\\\vdots\\y_n\end{pmatrix}$,有$$\frac{\left(\alpha^TA\alpha\right)\left(\alpha^TA^{‐1}\alpha\right)}{\alpha^T\alpha}=\frac{(\alpha^TT)(T^TAT)(T^T\alpha)(\alpha^TT)(T^TA^{‐1}T)(T^T\alpha)}{(\alpha^TT)(T^T\alpha)}=\frac{(\lambda_1y_1^2+\cdots+\lambda_ny_n^2)(\lambda_1^{‐1}y_1^2+\cdots+\lambda_n^{‐1}y_n^2)}{y_1^2+\cdots+y_n^2}$$
令$\triangle=y_1^2+\cdots+y_n^2$,$$则原式=\frac{\displaystyle\sum_{i=1}^ny_i^4+\sum_{1\leq i<j\leq n}\left(\frac{\displaystyle\lambda_i}{\displaystyle\lambda_j}+\frac{\displaystyle\lambda_j}{\displaystyle\lambda_i}\right)y_i^2y_j^2}\triangle=\frac{\triangle^2+{\displaystyle\sum_{1\leq i<j\leq n}}\left(\sqrt{\frac{\lambda_i}{\lambda_j}}-\sqrt{\frac{\lambda_j}{\lambda_i}}\right)^2y_i^2y_j^2}\triangle$$
由$$\left(\sqrt{\frac{\lambda_1}{\lambda_n}}-\sqrt{\frac{\lambda_n}{\lambda_1}}\right)^2-\left(\sqrt{\frac{\lambda_i}{\lambda_j}}-\sqrt{\frac{\lambda_j}{\lambda_i}}\right)^2=\frac{\lambda_1^2+\lambda_n^2}{\lambda_1\lambda_n}-\frac{\lambda_i^2+\lambda_j^2}{\lambda_i\lambda_j}=\frac{(\lambda_n\lambda_j-\lambda_i\lambda_1)(\lambda_i\lambda_n-\lambda_1\lambda_j)}{\lambda_1\lambda_n\lambda_i\lambda_j}$$
因为$\lambda_n\lambda_j-\lambda_i\lambda_1 \geq 0 ,\lambda_i\lambda_n-\lambda_1\lambda_j \geq 0$,则$\left(\sqrt{\frac{\lambda_1}{\lambda_n}}-\sqrt{\frac{\lambda_n}{\lambda_1}}\right)^2 \geq \left(\sqrt{\frac{\lambda_i}{\lambda_j}}-\sqrt{\frac{\lambda_j}{\lambda_i}}\right)^2$
$$\Rightarrow 原式\leq \triangle+\frac{({\displaystyle\sum_{1\leq i<j\leq n}}y_i^2y_j^2)\left(\sqrt{\frac{\lambda_1}{\lambda_n}}-\sqrt{\frac{\lambda_n}{\lambda_1}}\right)^2}\triangle=\triangle\left[1+\frac{({\displaystyle\sum_{1\leq i<j\leq n}}y_i^2y_j^2)\left(\sqrt{\frac{\lambda_1}{\lambda_n}}-\sqrt{\frac{\lambda_n}{\lambda_1}}\right)^2}{\triangle^2}\right]$$
由$$\triangle^2=(y_1^2+\cdots+y_n^2)^2=y_1^4+\cdots+y_n^4+2\sum_{1\leq i<j\leq n}y_i^2y_j^2$$
$$=\left(\frac{y_1^2}{\sqrt{n-1}}-\frac{y_2^2}{\sqrt{n-1}}\right)^2+\cdots+\left(\frac{y_1^2}{\sqrt{n-1}}-\frac{y_n^2}{\sqrt{n-1}}\right)^2+\cdots+\left(\frac{y_{n-1}^2}{\sqrt{n-1}}-\frac{y_n^2}{\sqrt{n-1}}\right)^2+\frac2{n-1}\sum_{1\leq i<j\leq n}y_i^2y_j^2+2\sum_{1\leq i<j\leq n}y_i^2y_j^2\geq\frac{2n}{n-1}\sum_{1\leq i<j\leq n}y_i^2y_j^2$$
$$\Rightarrow \frac{n-1}{2n}\geq\frac1{\triangle^2}\sum_{1\leq i<j\leq n}y_i^2y_j^2,且因为\triangle\leq1$$
$\Rightarrow 原式\leq1+\frac{n-1}{2n}\left(\sqrt{\frac{\lambda_1}{\lambda_n}}-\sqrt{\frac{\lambda_n}{\lambda_1}}\right)^2=\frac{(n-1)\lambda_1^2+2\lambda_1\lambda_n+(n-1)\lambda_n^2}{2n\lambda_1\lambda_n}\\\leq\frac{(n-1)\lambda_1^2+2(n-1)\lambda_1\lambda_n+(n-1)\lambda_n^2}{2n\lambda_1\lambda_n}=\frac{(n-1)(\lambda_1+\lambda_n)^2}{2n\lambda_1\lambda_n}$

若当—谢瓦莱(Jordan-Chevalley)分解定理证明

引理1:已知$g_1(x),g_2(x),\cdots,g_k(x)$两两互素,$r_1(x),r_2(x),\cdots,r_k(x)$为$k$个非零多项式,并且$\partial(r_i(x))<\partial(g_i(x))\;\;(i=1,2,\cdots,k)$,求存在一个多项式$f(x)$,被$g_i(x)除余式是r_i(x)$

证明:令$G_i(x)=g_1(x)\cdots g_{i-1}(x)g_{i+1}(x) \cdots g_k(x)$,因为$g_1(x),g_2(x),\cdots,g_k(x)$两两互素
$\Rightarrow(g_i(x),G_i(x))=1  \Rightarrow 存在u_i(x)g_i(x)+v_i(x)G_i(x)=1$
$\Rightarrow u_i(x)g_i(x)r_i(x)+v_i(x)G_i(x)r_i(x)=r_i(x)  \Rightarrow v_i(x)G_i(x)r_i(x)=r_i(x)-u_i(x)g_i(x)r_i(x)$,所以$g_1(x),\cdots ,g_{i-1}(x),g_{i+1}(x), \cdots ,g_k(x)都整除v_i(x)G_i(x)r_i(x) ,而g_i(x)除v(x)G_i(x)r_i(x) 余r_i(x),取$
$$f(x)=\sum_{i=1}^kv_i(x)G_i(x)r_i(x)=v_1(x)G_1(x)r_1(x)+\cdots+v_k(x)G_k(x)r_k(x) $$
$\Rightarrow g_i(x)除f(x)余式r_i(x)$
引理2:已知$A,B$都是$n$级方阵,$AB=BA$,且$A,B$均可对角化,证明$A,B$可以同时对角化。
证明:由于$A$可对角化。所以存在可逆矩阵$P$使得$P^{-1}AP=diag\{\lambda_1E_1,\lambda_2E_2,\cdots,\lambda_sE_s\}$,其中$\lambda_1,\lambda_2,\cdots,\lambda_s是A所有互异的特征值,E_1,E_2,\cdots,E_s分别是r_1,r_2,\cdots,r_s级单位矩阵$,且$r_1+r_2+\cdots+r_s=n$,由$AB=BA得P^{-1}BPP^{-1}AP=P^{-1}APP^{-1}BP$
$\Rightarrow P^{-1}BP=diag\{B_1,B_2,\cdots,B_s\},B_1,B_2,\cdots,B_s分别是r_1,r_2,\cdots,r_s级方阵$
由$B$可对角化,所以$P^{-1}BP$可以对角化   $\Rightarrow B_1,B_2,\cdots,B_s可以对角化$
$$\Rightarrow 对任意的i=1,2,\cdots ,s,存在可逆矩阵Q_i使得Q_i^{-1}B_iQ_i为对角矩阵。$$
取$Q=diag\{Q_1,Q_2,\cdots,Q_s\},则Q^{-1}P^{-1}BPQ=diag\{Q_1^{-1}B_1Q_1,Q_2^{-1}B_2Q_2,\cdots,Q_s^{-1}B_sQ_s\}为对角矩阵$
$$\Rightarrow 取T=PQ,有T^{-1}BT,T^{-1}BT同时为对角矩阵。$$
(来自复旦大学高代教材的证明过程)
若当—谢瓦莱(Jordan-Chevalley)分解定理:设A是$n$阶复矩阵,则$A$可分解为$A=B+C$,其中$B,C$适合下面的条件:
(1)$B$是一个可对角化的矩阵
(2)$C$是一个幂零矩阵
(3)$BC=CB$
(4)$B,C$均可表示为$A$的多项式
不仅如此,上述满足条件(1)——(3)分解是唯一的。
证明:先对$A$的若当标准形$J$证明结论,
设$A$的全体不同特征值为$\lambda_1,\lambda_2,\cdots,\lambda_s,且J=\begin{pmatrix}J_1&&&\\&J_2&&\\&&\ddots&\\&&&J_s\end{pmatrix},其中J_i是属于特征值\lambda_i的根子空间对应的块,其阶设为m_i.$显然,对每个$i$均有$J_i=M_i+N_i,其中M_i=\lambda_iI是对角阵,N_i是一个幂零矩阵。又M_iN_i=N_iM_i。$
$令M=\begin{pmatrix}M_1&&&\\&M_2&&\\&&\ddots&\\&&&M_S\end{pmatrix},N=\begin{pmatrix}N_1&&&\\&N_2&&\\&&\ddots&\\&&&N_S\end{pmatrix},$
则$J=M+N,MN=NM,M是对角阵,N是幂零矩阵。$
   因为$(J_i-\lambda_i I)^{m_i} =0$,所以$J_i$适合多项式$(\lambda-\lambda_i)^{m_i}$.而$\lambda_i互不相同$,因此多项式$(\lambda-\lambda_1)^{m_1},(\lambda-\lambda_2)^{m_2},\cdots ,(\lambda-\lambda_s)^{m_s}$两两互素。由引理1,存在多项式$g(\lambda)$满足条件:
$$g(\lambda)=h_i(\lambda)(\lambda-\lambda_i)^{m_i}+\lambda_i,对所有的i=1,2,\cdots ,s成立(这里h_i(\lambda)也是多项式)。$$
代入$J_i$得到$$g(J_i)=h_i(J_i)(J_i-\lambda_i I)^{m_i}+\lambda_i I=\lambda_i I=M_i$$
于是$$g(J)=\begin{pmatrix}g(J_1)&&&\\&g(J_2)&&\\&&\ddots&\\&&&g(J_s)\end{pmatrix}=\begin{pmatrix}M_1&&&\\&M_2&&\\&&\ddots&\\&&&M_s\end{pmatrix}=M.$$
又因为$N=J-M=J-g(J),$所以$N$也是$J$的多项式。
  现考虑一般情况:设$P^{-1}AP=J,则A=PJP^{-1}=P(M+N)P^{-1}$
令$B=PMP^{-1},C=PNP^{-1},则B是可对角化矩阵,而C是幂零矩阵,又g(A)=g(PJP^{-1})=Pg(J)P^{-1}=PMP^{-1}=B$
又易证明$BC=CB(\because MN=NM\Rightarrow PMP^{-1}PNP^{-1}=PNP^{-1}PMP^{-1}),C=A-g(A)$
   (注意方法)最后证明唯一性,假设$A$有另一满足条件的分解$A=B_1+C_1,则B_1-B=C_1-C。由B_1C_1=C_1B_1不难验证AB_1=B_1A , AC_1=C_1A (注:在A=B_1+C_1右乘B_1,得AB_1=B_1B_1+C_1B_1=B_1B_1+B_1C_1=B_1A ,同理AC_1=C_1A).$
因为$B=g(A),故BB_1=B_1B 。同理CC_1=C_1C 。设C^r =0,C_1^t =0 ,用二项式定理知道(C_1-C)^{r+t}=0 。于是$
$$(B_1-B)^{r+t}=(C_1-C)^{r+t}=0.$$
因为$BB_1=B_1B$,他们都是可对角化的矩阵,由引理2知道它们可以同时对角化,即存在可逆阵$Q$,使得$Q^{-1}BQ和Q^{-1}B_1Q$都是对角阵。注意到$$(Q^{-1}BQ-Q^{-1}B_1Q)^{r+t}=\lbrack Q^{-1}(B-B_1)Q\rbrack^{r+t}=Q^{-1}(B-B_1)^{r+t}Q=0,$$
两个对角阵之差依旧是对角阵,这个差的幂要等于零矩阵,这两个矩阵必相等,由此即得$B=B_1,于是C=C_1.证毕          \square$
一道似乎不好下手的高代题
此题是我发在论坛里面的一个问题,在论坛好友jiangjun7116的指导下,现在把过程完整的总结分享给大家。
设$A$为$n$阶实对称正定矩阵,$\beta_1,\beta_2,\cdots ,\beta_n \in \mathbb{R}^n$是$n$个关于$A$共轭的非零列向量,即$\beta_i\neq 0(i=1,2,\cdots,n)$,且$\beta_i ^TA\beta_j=0 (i\neq j;i,j=1,2,\cdots,n)$,证明:$$A=\sum_{i=1}^n\frac{A\beta_i\beta_i^TA}{\beta_i^TA\beta_i}和A^{-1}=\sum_{i=1}^n\frac{\beta_i\beta_i^T}{\beta_i^TA\beta_i}$$
证明:根据题目注意到$$\sum_{i=1}^n\frac{A\beta_i\beta_i^TA}{\beta_i^TA\beta_i}\beta_j=A\beta_j ,\sum_{i=1}^n\frac{\beta_i\beta_i^T}{\beta_i^TA\beta_i}A\beta_j=\beta_j$$
$$(因为i\neq j时\beta_i ^TA\beta_j=0,所以累加里面只有i=j那一项不等于0)$$
下证$\beta_1,\beta_2,\cdots ,\beta_n是一组基,即\beta_1,\beta_2,\cdots ,\beta_n是线性无关的$
假设存在一组实数$k_1,k_2,\cdots ,k_n使得k_1\beta_1+k_2\beta_2+\cdots +k_n\beta_n=0,式子两边左乘\beta_i^TA,$
$可以得出k_i\beta_i^TA\beta_i=0,然而A是实对称的正定矩阵且\beta_i \neq 0,可以得出k_i=0(i=1,2,\cdots ,n)$
$所以\beta_1,\beta_2,\cdots ,\beta_n是一组线性无关的向量组$
$$\Rightarrow (\sum_{i=1}^n\frac{A\beta_i\beta_i^TA}{\beta_i^TA\beta_i}-A)X=0, (\sum_{i=1}^n\frac{\beta_i\beta_i^T}{\beta_i^TA\beta_i}A-E)X=0有n个线性无关的解$$
$$\Rightarrow \sum_{i=1}^n\frac{A\beta_i\beta_i^TA}{\beta_i^TA\beta_i}-A=0, \sum_{i=1}^n\frac{\beta_i\beta_i^T}{\beta_i^TA\beta_i}A-E=0$$
$$即 \sum_{i=1}^n\frac{A\beta_i\beta_i^TA}{\beta_i^TA\beta_i}=A, \sum_{i=1}^n\frac{\beta_i\beta_i^T}{\beta_i^TA\beta_i}A=E \Rightarrow  \sum_{i=1}^n\frac{\beta_i\beta_i^T}{\beta_i^TA\beta_i}=A^{-1}$$
“许多问题解决之后都会一阵暗爽,这可能就是我喜欢数学的原因吧!”

周不通问题:

一个方阵总相似于它自己的转置。那么,方阵总合同于自己的转置吗?
即:对于任意方阵A,证明存在可逆方阵P,使得 P'AP=A'。
容易证明,对于A=E+B,B反对称,是对的。猜想一般情形也对。
各位看看。


证明:两个实反对称矩阵彼此合同充要条件是秩相等。

猜你喜欢

转载自www.cnblogs.com/Eufisky/p/9998482.html
今日推荐