机器学习数学基础:23.二次型及其标准形
二次型及其标准形
一、二次型基础
(一)定义剖析
二次型是包含NNN个变量X1,X2,⋯ ,XNX_1, X_2, \cdots, X_NX1,X2,⋯,XN的不含常数项的二次齐次多项式。所谓二次齐次,即每一项中未知数的次数总和恒为222。
例如,当N =3N \ = 3N =3时,f(x1,x2,x3) =2x12+3x1x2−4x2x3+5x32f(x_1, x_2, x_3)\ =2x_1^2 + 3x_1x_2 - 4x_2x_3+5x_3^2f(x1,x2,x3) =2x12+3x1x2−4x2x3+5x32是二次型。其中2x122x_1^22x12中x1x_1x1次数为222;3x1x23x_1x_23x1x2里x1x_1x1与x2x_2x2次数和为222;−4x2x3-4x_2x_3−4x2x3中x2x_2x2与x3x_3x3次数和是222;5x325x_3^25x32中x3x_3x3次数为222。
(二)与矩阵的紧密联系
任意二次型均可写成XTAXX^TAXXTAX的形式。其中X =(x1x2⋮xN)X\ =\begin{pmatrix}x_1\\x_2\\\vdots\\x_N\end{pmatrix}X = x1x2⋮xN 是变量构成的列向量,AAA是对称矩阵且具有唯一性。
以f(x1,x2) =4x12+6x1x2+8x22f(x_1, x_2)\ =4x_1^2 + 6x_1x_2 + 8x_2^2f(x1,x2) =4x12+6x1x2+8x22为例,可写成(x1x2)(4338)(x1x2)\begin{pmatrix}x_1&x_2\end{pmatrix}\begin{pmatrix}4&3\\3&8\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}(x1x2)(4338)(x1x2)。这里的对称矩阵(4338)\begin{pmatrix}4&3\\3&8\end{pmatrix}(4338)便是该二次型对应的矩阵。
(三)二次型矩阵的生成方法
以含有四个变量x1,x2,x3,x4x_1, x_2, x_3, x_4x1,x2,x3,x4的二次型f(x1,x2,x3,x4) =3x12+5x1x2+7x1x3+9x1x4+11x2x1+13x22+15x2x3+17x2x4+19x3x1+21x3x2+23x32+25x3x4+27x4x1+29x4x2+31x4x3+33x42f(x_1, x_2, x_3, x_4)\ =3x_1^2 + 5x_1x_2+7x_1x_3 + 9x_1x_4+11x_2x_1+13x_2^2+15x_2x_3 + 17x_2x_4+19x_3x_1+21x_3x_2+23x_3^2+25x_3x_4+27x_4x_1+29x_4x_2+31x_4x_3+33x_4^2f(x1,x2,x3,x4) =3x12+5x1x2+7x1x3+9x1x4+11x2x1+13x22+15x2x3+17x2x4+19x3x1+21x3x2+23x32+25x3x4+27x4x1+29x4x2+31x4x3+33x42为例。
构建一个4×44\times44×4的表格:
| x1x_1x1 | x2x_2x2 | x3x_3x3 | x4x_4x4 | |
|---|---|---|---|---|
| x1x_1x1 | ||||
| x2x_2x2 | ||||
| x3x_3x3 | ||||
| x4x_4x4 |
对于x12x_1^2x12的系数333,填入第一行第一列;对于x1x2x_1x_2x1x2的系数555,将其一半52\frac{5}{2}25分别填入第一行第二列和第二行第一列;对于x1x3x_1x_3x1x3的系数777,把72\frac{7}{2}27分别填入第一行第三列和第三行第一列;以此类推。
最终得到二次型矩阵A =(3527292521315217272152232529217225233)A \ = \begin{pmatrix}3&\frac{5}{2}&\frac{7}{2}&\frac{9}{2}\\\frac{5}{2}&13&\frac{15}{2}&\frac{17}{2}\\\frac{7}{2}&\frac{15}{2}&23&\frac{25}{2}\\\frac{9}{2}&\frac{17}{2}&\frac{25}{2}&33\end{pmatrix}A = 3252729251321521727215232252921722533 。
二、线性变换与二次型标准型
(一)线性变换的基本认知
线性变换是对向量实施的一种变换操作。若有向量X =(x1x2)X\ =\begin{pmatrix}x_1\\x_2\end{pmatrix}X =(x1x2),矩阵C =(2345)C\ =\begin{pmatrix}2&3\\4&5\end{pmatrix}C =(2435),则Y =CX =(2345)(x1x2) =(2x1+3x24x1+5x2)Y \ = CX\ =\begin{pmatrix}2&3\\4&5\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}2x_1 + 3x_2\\4x_1+5x_2\end{pmatrix}Y =CX =(2435)(x1x2) =(2x1+3x24x1+5x2),实现了向量XXX到向量YYY的变换。
(二)可逆线性变换的特性
可逆线性变换存在逆操作,能将变换后的向量还原。如Y =CXY \ = CXY =CX,若存在矩阵C−1C^{-1}C−1使X =C−1YX \ = C^{-1}YX =C−1Y,则该线性变换可逆。可逆线性变换不会丢失信息,而不可逆变换因可能导致信息缺失,在二次型研究中通常不被考虑。
(三)借助线性变换实现二次型到标准型的转化
设有二次型f(X) =XTAXf(X)\ =X^TAXf(X) =XTAX,期望通过线性变换化为标准型(仅含平方项,无交叉项,如f(y1,y2) =k1y12+k2y22f(y_1, y_2)\ =k_1y_1^2 + k_2y_2^2f(y1,y2) =k1y12+k2y22) 。
采用可逆线性变换X =CYX \ = CYX =CY(CCC为可逆矩阵) ,将其代入f(X)f(X)f(X)得f(Y) =YT(CTAC)Yf(Y)\ =Y^T(C^TAC)Yf(Y) =YT(CTAC)Y。若能找出合适的CCC使CTACC^TACCTAC为对角矩阵,f(Y)f(Y)f(Y)即为标准型。
例如,二次型f(x1,x2) =2x12+4x1x2+3x22f(x_1, x_2)\ =2x_1^2 + 4x_1x_2+3x_2^2f(x1,x2) =2x12+4x1x2+3x22,其矩阵A =(2223)A\ =\begin{pmatrix}2&2\\2&3\end{pmatrix}A =(2223)。选取可逆矩阵C =(1−101)C\ =\begin{pmatrix}1& - 1\\0&1\end{pmatrix}C =(10−11)。
先计算CT =(10−11)C^T\ =\begin{pmatrix}1&0\\ - 1&1\end{pmatrix}CT =(1−101),再算CTAC =(10−11)(2223)(1−101) =(2001)C^TAC\ =\begin{pmatrix}1&0\\ - 1&1\end{pmatrix}\begin{pmatrix}2&2\\2&3\end{pmatrix}\begin{pmatrix}1& - 1\\0&1\end{pmatrix}\ =\begin{pmatrix}2&0\\0&1\end{pmatrix}CTAC =(1−101)(2223)(10−11) =(2001)。
设X =(x1x2)X\ =\begin{pmatrix}x_1\\x_2\end{pmatrix}X =(x1x2),Y =(y1y2)Y\ =\begin{pmatrix}y_1\\y_2\end{pmatrix}Y =(y1y2),由X =CYX \ = CYX =CY即(x1x2) =(1−101)(y1y2) =(y1−y2y2)\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}1& - 1\\0&1\end{pmatrix}\begin{pmatrix}y_1\\y_2\end{pmatrix}\ =\begin{pmatrix}y_1 - y_2\\y_2\end{pmatrix}(x1x2) =(10−11)(y1y2) =(y1−y2y2)。
则f(Y) =YT(CTAC)Y =(y1y2)(2001)(y1y2) =2y12+y22f(Y)\ =Y^T(C^TAC)Y\ =\begin{pmatrix}y_1&y_2\end{pmatrix}\begin{pmatrix}2&0\\0&1\end{pmatrix}\begin{pmatrix}y_1\\y_2\end{pmatrix}\ =2y_1^2 + y_2^2f(Y) =YT(CTAC)Y =(y1y2)(2001)(y1y2) =2y12+y22,成功化为标准型。
三、合同对角化与正交变换化标准型
(一)合同的定义阐释
设AAA和BBB为两个nnn阶矩阵,若存在可逆矩阵CCC使B =CTACB \ = C^TACB =CTAC,则称AAA与BBB合同。即便矩阵非实对称,满足此条件也属合同。
(二)合同对角化实例
对于对称矩阵A =(1221)A\ =\begin{pmatrix}1&2\\2&1\end{pmatrix}A =(1221),可进行正交相似对角化。
先求其特征值,特征多项式为∣λE−A∣ =∣λ−1−2−2λ−1∣ =(λ−1)2−4 =λ2−2λ−3 =(λ−3)(λ+1)\vert\lambda E - A\vert\ =\begin{vmatrix}\lambda - 1& - 2\\ - 2&\lambda - 1\end{vmatrix}\ =(\lambda - 1)^2 - 4\ =\lambda^2 - 2\lambda - 3 \ = (\lambda - 3)(\lambda + 1)∣λE−A∣ = λ−1−2−2λ−1 =(λ−1)2−4 =λ2−2λ−3 =(λ−3)(λ+1)。
令∣λE−A∣ =0\vert\lambda E - A\vert \ = 0∣λE−A∣ =0,解得特征值λ1 =3\lambda_1 \ = 3λ1 =3,λ2 =−1\lambda_2 \ = - 1λ2 =−1。
对于λ1 =3\lambda_1 \ = 3λ1 =3,解齐次线性方程组(3E−A)X =0(3E - A)X \ = 0(3E−A)X =0,即(2−2−22)(x1x2) =(00)\begin{pmatrix}2& - 2\\ - 2&2\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}0\\0\end{pmatrix}(2−2−22)(x1x2) =(00),得特征向量ξ1 =(11)\xi_1\ =\begin{pmatrix}1\\1\end{pmatrix}ξ1 =(11),单位化后γ1 =12(11)\gamma_1\ =\frac{1}{\sqrt{2}}\begin{pmatrix}1\\1\end{pmatrix}γ1 =21(11)。
对于λ2 =−1\lambda_2 \ = - 1λ2 =−1,解齐次线性方程组(−E−A)X =0( - E - A)X \ = 0(−E−A)X =0,即(−2−2−2−2)(x1x2) =(00)\begin{pmatrix}-2& - 2\\ - 2&-2\end{pmatrix}\begin{pmatrix}x_1\\x_2\end{pmatrix}\ =\begin{pmatrix}0\\0\end{pmatrix}(−2−2−2−2)(x1x2) =(00),得特征向量ξ2 =(1−1)\xi_2\ =\begin{pmatrix}1\\ - 1\end{pmatrix}ξ2 =(1−1),单位化后γ2 =12(1−1)\gamma_2\ =\frac{1}{\sqrt{2}}\begin{pmatrix}1\\ - 1\end{pmatrix}γ2 =21(1−1)。
令正交矩阵Q =(γ1,γ2) =(121212−12)Q \ = (\gamma_1,\gamma_2)\ =\begin{pmatrix}\frac{1}{\sqrt{2}}&\frac{1}{\sqrt{2}}\\\frac{1}{\sqrt{2}}&-\frac{1}{\sqrt{2}}\end{pmatrix}Q =(γ1,γ2) =(212121−21),则QTAQ =(300−1)Q^TAQ\ =\begin{pmatrix}3&0\\0& - 1\end{pmatrix}QTAQ =(300−1),实现了合同对角化,这里QQQ是可逆矩阵CCC的特殊形式。
(三)正交变换化标准型解析
正交变换是借助正交矩阵QQQ进行的线性变换,即X =QYX \ = QYX =QY。将其用于二次型f(X) =XTAXf(X)\ =X^TAXf(X) =XTAX,可得f(Y) =YT(QTAQ)Y =YTΛYf(Y)\ =Y^T(Q^TAQ)Y \ = Y^T\Lambda Yf(Y) =YT(QTAQ)Y =YTΛY,Λ\LambdaΛ为对角矩阵,对角元素是矩阵AAA的特征值。
此外,配方法也是可逆线性变换的一种。比如二次型f(x1,x2) =x12+6x1x2+10x22f(x_1, x_2)\ =x_1^2 + 6x_1x_2+10x_2^2f(x1,x2) =x12+6x1x2+10x22,配方如下:
f(x1,x2) =x12+6x1x2+10x22 =(x12+6x1x2+9x22)+x22 =(x1+3x2)2+x22 \begin{align*} f(x_1, x_2)&\ =x_1^2 + 6x_1x_2+10x_2^2\\ &\ =(x_1^2 + 6x_1x_2 + 9x_2^2)+x_2^2\\ &\ =(x_1 + 3x_2)^2+x_2^2 \end{align*} f(x1,x2) =x12+6x1x2+10x22 =(x12+6x1x2+9x22)+x22 =(x1+3x2)2+x22
设y1 =x1+3x2y_1\ =x_1 + 3x_2y1 =x1+3x2,y2 =x2y_2\ =x_2y2 =x2,即x1 =y1−3y2x_1\ =y_1 - 3y_2x1 =y1−3y2,x2 =y2x_2\ =y_2x2 =y2,这是可逆线性变换,将原二次型化为标准型f(y1,y2) =y12+y22f(y_1, y_2)\ =y_1^2 + y_2^2f(y1,y2) =y12+y22。
四、二次型的其他核心概念
(一)规范形系数为一的个数解读
二次型的规范型是标准型的特殊形式,系数仅为111、−1-1−1或000。规范形中系数为111的个数是关键特征。
例如规范型f(y1,y2,y3) =y12−y22+0y32f(y_1, y_2, y_3)\ =y_1^2 - y_2^2+0y_3^2f(y1,y2,y3) =y12−y22+0y32,系数为111的个数是111。
(二)二次型矩阵的秩与正负惯性指数的关系解读
二次型矩阵AAA的秩r(A)r(A)r(A)等于其规范形中系数不为000的项数。正惯性指数是规范形中系数为111的项数,负惯性指数是规范形中系数为−1-1−1的项数,满足r(A) =r(A)\ =r(A) =正惯性指数+++负惯性指数。
如规范型f(y1,y2,y3) =y12−y22+0y32f(y_1, y_2, y_3)\ =y_1^2 - y_2^2+0y_3^2f(y1,y2,y3) =y12−y22+0y32,正惯性指数为111,负惯性指数为111,矩阵的秩r(A) =1+1 =2r(A)\ =1 + 1 \ = 2r(A) =1+1 =2。
(三)惯性定理解读
惯性定理表明,二次型的正、负惯性指数由二次型自身唯一确定,与化为规范型所采用的可逆线性变换无关。
例如二次型f(x1,x2) =2x12−3x22f(x_1, x_2)\ =2x_1^2 - 3x_2^2f(x1,x2) =2x12−3x22,无论通过何种可逆线性变换化为规范型,正惯性指数始终为111(对应x12x_1^2x12项) ,负惯性指数始终为111(对应x22x_2^2x22项前面的负号) 。
以下是对线性代数中二次型相关内容的进一步拓展和详细讲解:
五、用正交变换化二次型为标准型的详细步骤及案例
(一)步骤详述
- 求二次型矩阵的特征值:对于二次型f(X) =XTAXf(X)\ =X^TAXf(X) =XTAX,先确定其对称矩阵AAA,然后计算特征多项式∣λE−A∣\vert\lambda E - A\vert∣λE−A∣,令∣λE−A∣ =0\vert\lambda E - A\vert \ = 0∣λE−A∣ =0,求解得到矩阵AAA的特征值λ1,λ2,⋯ ,λn\lambda_1,\lambda_2,\cdots,\lambda_nλ1,λ2,⋯,λn。这些特征值将构成最终标准型中平方项的系数。
- 求对应特征值的特征向量:针对每个特征值λi\lambda_iλi,解齐次线性方程组(λiE−A)X =0(\lambda_i E - A)X \ = 0(λiE−A)X =0,得到的基础解系就是λi\lambda_iλi对应的特征向量。这些特征向量是后续操作的基础。
- 特征向量的正交化:如果不同特征值对应的特征向量已经正交(实对称矩阵不同特征值对应的特征向量必定正交),则无需对它们进行正交化。但对于重特征值对应的特征向量,需要使用施密特正交化方法将其正交化。设重特征值λ\lambdaλ对应的特征向量为ξ1,ξ2,⋯ ,ξs\xi_1,\xi_2,\cdots,\xi_sξ1,ξ2,⋯,ξs(sss为重数),施密特正交化过程如下:
- 令β1 =ξ1\beta_1 \ = \xi_1β1 =ξ1;
-β2 =ξ2−(ξ2,β1)(β1,β1)β1\beta_2 \ = \xi_2 - \frac{(\xi_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1β2 =ξ2−(β1,β1)(ξ2,β1)β1;
-β3 =ξ3−(ξ3,β1)(β1,β1)β1−(ξ3,β2)(β2,β2)β2\beta_3 \ = \xi_3 - \frac{(\xi_3,\beta_1)}{(\beta_1,\beta_1)}\beta_1 - \frac{(\xi_3,\beta_2)}{(\beta_2,\beta_2)}\beta_2β3 =ξ3−(β1,β1)(ξ3,β1)β1−(β2,β2)(ξ3,β2)β2; - 以此类推,βs =ξs−∑i =1s−1(ξs,βi)(βi,βi)βi\beta_s \ = \xi_s - \sum_{i \ = 1}^{s - 1}\frac{(\xi_s,\beta_i)}{(\beta_i,\beta_i)}\beta_iβs =ξs−∑i =1s−1(βi,βi)(ξs,βi)βi。
- 令β1 =ξ1\beta_1 \ = \xi_1β1 =ξ1;
- 特征向量的单位化:将正交化后的特征向量(或者原本就正交的特征向量)进行单位化。对于向量β\betaβ,其单位向量γ =β∣β∣\gamma \ = \frac{\beta}{\vert\beta\vert}γ =∣β∣β,其中∣β∣ =(β,β)\vert\beta\vert \ = \sqrt{(\beta,\beta)}∣β∣ =(β,β)是向量β\betaβ的长度。
- 构造正交矩阵QQQ并得到标准型:把所有单位化后的特征向量按列排列,构成正交矩阵Q =(γ1,γ2,⋯ ,γn)Q \ = (\gamma_1,\gamma_2,\cdots,\gamma_n)Q =(γ1,γ2,⋯,γn)。通过正交变换X =QYX \ = QYX =QY,二次型f(X)f(X)f(X)可化为标准型f(Y) =YT(QTAQ)Y =YTΛYf(Y)\ =Y^T(Q^TAQ)Y \ = Y^T\Lambda Yf(Y) =YT(QTAQ)Y =YTΛY,其中Λ\LambdaΛ是对角矩阵,对角线上的元素就是前面求得的特征值。
(二)案例演示
设二次型f(x1,x2,x3) =2x12+5x22+5x32+4x1x2−4x1x3−8x2x3f(x_1,x_2,x_3)\ =2x_1^2 + 5x_2^2 + 5x_3^2 + 4x_1x_2 - 4x_1x_3 - 8x_2x_3f(x1,x2,x3) =2x12+5x22+5x32+4x1x2−4x1x3−8x2x3。
- 确定二次型矩阵AAA:
根据前面介绍的二次型矩阵的写法,可得A =(22−225−4−2−45)A \ = \begin{pmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{pmatrix}A = 22−225−4−2−45 。 - 求特征值:
计算特征多项式∣λE−A∣\vert\lambda E - A\vert∣λE−A∣:
∣λE−A∣ =∣λ−2−22−2λ−5424λ−5∣ =(λ−2)[(λ−5)2−16]+2[−2(λ−5)−8]+2[−8−2(λ−5)] =(λ−2)(λ2−10λ+25−16)−4(λ−5)−16−16−4(λ−5) =(λ−2)(λ2−10λ+9)−8(λ−5)−32 =(λ−2)(λ−1)(λ−9)−8λ+40−32 =(λ−2)(λ−1)(λ−9)−8λ+8 =(λ−1)[(λ−2)(λ−9)−8] =(λ−1)(λ2−11λ+18−8) =(λ−1)(λ2−11λ+10) =(λ−1)2(λ−10) \begin{align*} \vert\lambda E - A\vert&\ =\begin{vmatrix}\lambda - 2& - 2&2\\ - 2&\lambda - 5&4\\2&4&\lambda - 5\end{vmatrix}\\ &\ = (\lambda - 2)[(\lambda - 5)^2 - 16]+2[-2(\lambda - 5) - 8]+2[-8 - 2(\lambda - 5)]\\ &\ = (\lambda - 2)(\lambda^2 - 10\lambda + 25 - 16)-4(\lambda - 5) - 16 - 16 - 4(\lambda - 5)\\ &\ = (\lambda - 2)(\lambda^2 - 10\lambda + 9)-8(\lambda - 5) - 32\\ &\ = (\lambda - 2)(\lambda - 1)(\lambda - 9)-8\lambda + 40 - 32\\ &\ = (\lambda - 2)(\lambda - 1)(\lambda - 9)-8\lambda + 8\\ &\ = (\lambda - 1)[(\lambda - 2)(\lambda - 9) - 8]\\ &\ = (\lambda - 1)(\lambda^2 - 11\lambda + 18 - 8)\\ &\ = (\lambda - 1)(\lambda^2 - 11\lambda + 10)\\ &\ = (\lambda - 1)^2(\lambda - 10) \end{align*} ∣λE−A∣ = λ−2−22−2λ−5424λ−5 =(λ−2)[(λ−5)2−16]+2[−2(λ−5)−8]+2[−8−2(λ−5)] =(λ−2)(λ2−10λ+25−16)−4(λ−5)−16−16−4(λ−5) =(λ−2)(λ2−10λ+9)−8(λ−5)−32 =(λ−2)(λ−1)(λ−9)−8λ+40−32 =(λ−2)(λ−1)(λ−9)−8λ+8 =(λ−1)[(λ−2)(λ−9)−8] =(λ−1)(λ2−11λ+18−8) =(λ−1)(λ2−11λ+10) =(λ−1)2(λ−10)
令∣λE−A∣ =0\vert\lambda E - A\vert \ = 0∣λE−A∣ =0,解得特征值λ1 =λ2 =1\lambda_1 \ = \lambda_2 \ = 1λ1 =λ2 =1,λ3 =10\lambda_3 \ = 10λ3 =10。 - 求特征向量:
- 当λ1 =λ2 =1\lambda_1 \ = \lambda_2 \ = 1λ1 =λ2 =1时,解齐次线性方程组(E−A)X =0(E - A)X \ = 0(E−A)X =0,E−A =(−1−22−2−4424−4)E - A \ = \begin{pmatrix}-1& - 2&2\\ - 2& - 4&4\\2&4& - 4\end{pmatrix}E−A =
−1−22−2−4424−4
,通过初等行变换化为行最简形(12−2000000)\begin{pmatrix}1&2& - 2\\0&0&0\\0&0&0\end{pmatrix}
100200−200
。
令x3 =tx_3 \ = tx3 =t,x2 =sx_2 \ = sx2 =s,则x1 =2t−2sx_1 \ = 2t - 2sx1 =2t−2s,得到基础解系ξ1 =(2−10)\xi_1 \ = \begin{pmatrix}2\\ - 1\\0\end{pmatrix}ξ1 = 2−10 ,ξ2 =(201)\xi_2 \ = \begin{pmatrix}2\\0\\1\end{pmatrix}ξ2 = 201 。 - 当λ3 =10\lambda_3 \ = 10λ3 =10时,解齐次线性方程组(10E−A)X =0(10E - A)X \ = 0(10E−A)X =0,10E−A =(8−22−254245)10E - A \ = \begin{pmatrix}8& - 2&2\\ - 2&5&4\\2&4&5\end{pmatrix}10E−A =
8−22−254245
,通过初等行变换化为行最简形(1012011000)\begin{pmatrix}1&0&\frac{1}{2}\\0&1&1\\0&0&0\end{pmatrix}
1000102110
。
令x3 =2tx_3 \ = 2tx3 =2t,则x1 =−tx_1 \ = - tx1 =−t,x2 =−2tx_2 \ = - 2tx2 =−2t,得到基础解系ξ3 =(−1−22)\xi_3 \ = \begin{pmatrix}-1\\ - 2\\2\end{pmatrix}ξ3 = −1−22 。
- 当λ1 =λ2 =1\lambda_1 \ = \lambda_2 \ = 1λ1 =λ2 =1时,解齐次线性方程组(E−A)X =0(E - A)X \ = 0(E−A)X =0,E−A =(−1−22−2−4424−4)E - A \ = \begin{pmatrix}-1& - 2&2\\ - 2& - 4&4\\2&4& - 4\end{pmatrix}E−A =
−1−22−2−4424−4
,通过初等行变换化为行最简形(12−2000000)\begin{pmatrix}1&2& - 2\\0&0&0\\0&0&0\end{pmatrix}
100200−200
。
- 特征向量的正交化:
对于ξ1\xi_1ξ1和ξ2\xi_2ξ2(对应重特征值λ =1\lambda \ = 1λ =1),使用施密特正交化方法:
-β1 =ξ1 =(2−10)\beta_1 \ = \xi_1 \ = \begin{pmatrix}2\\ - 1\\0\end{pmatrix}β1 =ξ1 = 2−10 ;
-β2 =ξ2−(ξ2,β1)(β1,β1)β1\beta_2 \ = \xi_2 - \frac{(\xi_2,\beta_1)}{(\beta_1,\beta_1)}\beta_1β2 =ξ2−(β1,β1)(ξ2,β1)β1
(ξ2,β1) =2×2+0×(−1)+1×0 =4(\xi_2,\beta_1)\ =2\times2 + 0\times(-1)+1\times0 \ = 4(ξ2,β1) =2×2+0×(−1)+1×0 =4,(β1,β1) =22+(−1)2+02 =5(\beta_1,\beta_1)\ =2^2 + (-1)^2 + 0^2 \ = 5(β1,β1) =22+(−1)2+02 =5,
则β2 =(201)−45(2−10) =(25451)\beta_2 \ = \begin{pmatrix}2\\0\\1\end{pmatrix}-\frac{4}{5}\begin{pmatrix}2\\ - 1\\0\end{pmatrix}\ =\begin{pmatrix}\frac{2}{5}\\\frac{4}{5}\\1\end{pmatrix}β2 = 201 −54 2−10 = 52541 。
ξ3\xi_3ξ3与ξ1,ξ2\xi_1,\xi_2ξ1,ξ2(对应不同特征值)本身正交,无需正交化。 - 特征向量的单位化:
-∣β1∣ =22+(−1)2+02 =5\vert\beta_1\vert \ = \sqrt{2^2 + (-1)^2 + 0^2}\ =\sqrt{5}∣β1∣ =22+(−1)2+02 =5,γ1 =β1∣β1∣ =(25−150)\gamma_1 \ = \frac{\beta_1}{\vert\beta_1\vert}\ =\begin{pmatrix}\frac{2}{\sqrt{5}}\\-\frac{1}{\sqrt{5}}\\0\end{pmatrix}γ1 =∣β1∣β1 = 52−510 ;
-∣β2∣ =(25)2+(45)2+12 =35\vert\beta_2\vert \ = \sqrt{(\frac{2}{5})^2 + (\frac{4}{5})^2 + 1^2}\ =\frac{3}{\sqrt{5}}∣β2∣ =(52)2+(54)2+12 =53,γ2 =β2∣β2∣ =(235435535)\gamma_2 \ = \frac{\beta_2}{\vert\beta_2\vert}\ =\begin{pmatrix}\frac{2}{3\sqrt{5}}\\\frac{4}{3\sqrt{5}}\\\frac{5}{3\sqrt{5}}\end{pmatrix}γ2 =∣β2∣β2 = 352354355 ;
-∣ξ3∣ =(−1)2+(−2)2+22 =3\vert\xi_3\vert \ = \sqrt{(-1)^2 + (-2)^2 + 2^2}\ =3∣ξ3∣ =(−1)2+(−2)2+22 =3,γ3 =ξ3∣ξ3∣ =(−13−2323)\gamma_3 \ = \frac{\xi_3}{\vert\xi_3\vert}\ =\begin{pmatrix}-\frac{1}{3}\\-\frac{2}{3}\\\frac{2}{3}\end{pmatrix}γ3 =∣ξ3∣ξ3 = −31−3232 。 - 构造正交矩阵QQQ并得到标准型:
令Q =(γ1,γ2,γ3) =(25235−13−15435−23053523)Q \ = (\gamma_1,\gamma_2,\gamma_3)\ =\begin{pmatrix}\frac{2}{\sqrt{5}}&\frac{2}{3\sqrt{5}}&-\frac{1}{3}\\-\frac{1}{\sqrt{5}}&\frac{4}{3\sqrt{5}}&-\frac{2}{3}\\0&\frac{5}{3\sqrt{5}}&\frac{2}{3}\end{pmatrix}Q =(γ1,γ2,γ3) = 52−510352354355−31−3232 ,通过正交变换X =QYX \ = QYX =QY,二次型f(X)f(X)f(X)化为标准型f(Y) =YT(QTAQ)Y =y12+y22+10y32f(Y)\ =Y^T(Q^TAQ)Y \ = y_1^2 + y_2^2 + 10y_3^2f(Y) =YT(QTAQ)Y =y12+y22+10y32。
六、二次型正定性的判定
(一)正定性的定义
设f(X) =XTAXf(X)\ =X^TAXf(X) =XTAX是实二次型,如果对于任意非零向量XXX,都有f(X)>0f(X)>0f(X)>0,则称二次型f(X)f(X)f(X)为正定二次型,此时矩阵AAA称为正定矩阵;如果对于任意非零向量XXX,都有f(X)≥0f(X)\geq0f(X)≥0,则称二次型f(X)f(X)f(X)为半正定二次型,矩阵AAA称为半正定矩阵;如果对于任意非零向量XXX,都有f(X)<0f(X)<0f(X)<0,则称二次型f(X)f(X)f(X)为负定二次型,矩阵AAA称为负定矩阵;如果对于任意非零向量XXX,都有f(X)≤0f(X)\leq0f(X)≤0,则称二次型f(X)f(X)f(X)为半负定二次型,矩阵AAA称为半负定矩阵;如果f(X)f(X)f(X)的值有正有负,则称二次型f(X)f(X)f(X)为不定二次型。
(二)判定方法
- 特征值法:实对称矩阵AAA正定的充分必要条件是AAA的特征值全大于000;实对称矩阵AAA半正定的充分必要条件是AAA的特征值全大于等于000;实对称矩阵AAA负定的充分必要条件是AAA的特征值全小于000;实对称矩阵AAA半负定的充分必要条件是AAA的特征值全小于等于000;实对称矩阵AAA不定的充分必要条件是AAA的特征值有正有负。
例如,对于前面提到的矩阵A =(22−225−4−2−45)A \ = \begin{pmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{pmatrix}A = 22−225−4−2−45 ,其特征值为1,1,101,1,101,1,10,全大于000,所以对应的二次型f(x1,x2,x3)f(x_1,x_2,x_3)f(x1,x2,x3)是正定二次型,矩阵AAA是正定矩阵。 - 顺序主子式法:实对称矩阵A =(aij)n×nA\ =(a_{ij})_{n\times n}A =(aij)n×n的各阶顺序主子式全大于000,则AAA是正定矩阵。AAA的kkk阶顺序主子式是指AAA的左上角k×kk\times kk×k阶子矩阵的行列式,记为PkP_kPk,k =1,2,⋯ ,nk \ = 1,2,\cdots,nk =1,2,⋯,n。
例如,对于矩阵A =(22−225−4−2−45)A \ = \begin{pmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{pmatrix}A = 22−225−4−2−45 :
-P1 =∣2∣ =2>0P_1 \ = \vert2\vert \ = 2>0P1 =∣2∣ =2>0;
-P2 =∣2225∣ =2×5−2×2 =6>0P_2 \ = \begin{vmatrix}2&2\\2&5\end{vmatrix}\ =2\times5 - 2\times2 \ = 6>0P2 = 2225 =2×5−2×2 =6>0;
-P3 =∣22−225−4−2−45∣ =2×∣5−4−45∣−2×∣2−4−25∣−2×∣25−2−4∣ =2×(25−16)−2×(10−8)−2×(−8+10) =18−4−4 =10>0P_3 \ = \begin{vmatrix}2&2& - 2\\2&5& - 4\\ - 2& - 4&5\end{vmatrix}\ = 2\times\begin{vmatrix}5& - 4\\ - 4&5\end{vmatrix}-2\times\begin{vmatrix}2& - 4\\ - 2&5\end{vmatrix}-2\times\begin{vmatrix}2&5\\ - 2& - 4\end{vmatrix}\ = 2\times(25 - 16)-2\times(10 - 8)-2\times(-8 + 10)\ = 18 - 4 - 4 \ = 10>0P3 = 22−225−4−2−45 =2× 5−4−45 −2× 2−2−45 −2× 2−25−4 =2×(25−16)−2×(10−8)−2×(−8+10) =18−4−4 =10>0。
各阶顺序主子式全大于000,所以矩阵AAA是正定矩阵,二次型f(x1,x2,x3)f(x_1,x_2,x_3)f(x1,x2,x3)是正定二次型。
更多推荐



所有评论(0)