机器学习数学基础:18.向量组及其线性组合
向量组及其线性组合
向量组与线性表示:案例与教程详解
一、基础概念
(一)向量组
向量组是若干同位数列向量组成的集合。比如在平面直角坐标系中,向量组{α⃗1 =[10],α⃗2 =[01]}\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}, \vec{\alpha}_2 \ = \begin{bmatrix}0\\1\end{bmatrix}\}{α1 =[10],α2 =[01]},这两个向量都是二维列向量,构成了一个简单的向量组。再如三维空间里的向量组{β⃗1 =[123],β⃗2 =[456]}\{\vec{\beta}_1 \ = \begin{bmatrix}1\\2\\3\end{bmatrix}, \vec{\beta}_2 \ = \begin{bmatrix}4\\5\\6\end{bmatrix}\}{β1 = 123 ,β2 = 456 },它们是三维列向量组。
(二)秩
秩可理解为有效方程或独立向量的个数。以方程组{x+2y =32x+4y =6\begin{cases}x + 2y \ = 3 \\ 2x + 4y \ = 6\end{cases}{x+2y =32x+4y =6为例,第二个方程是第一个方程的 2 倍,实际上只有一个有效方程,对应的向量组{[12],[24]}\{\begin{bmatrix}1\\2\end{bmatrix}, \begin{bmatrix}2\\4\end{bmatrix}\}{[12],[24]}的秩为 1,因为只有一个独立向量(第二个向量可由第一个向量乘以 2 得到)。确定秩的方法通常是将向量组构成的矩阵化为行阶梯形矩阵,非零行的行数就是秩。
二、向量的线性表示
(一)定义与判定
若存在一组数λ1,λ2,⋯ ,λm\lambda_1, \lambda_2, \cdots, \lambda_mλ1,λ2,⋯,λm,使β⃗ =λ1α⃗1+λ2α⃗2+⋯+λmα⃗m\vec{\beta} \ = \lambda_1\vec{\alpha}_1 + \lambda_2\vec{\alpha}_2 + \cdots + \lambda_m\vec{\alpha}_mβ =λ1α1+λ2α2+⋯+λmαm,则向量β⃗\vec{\beta}β能由向量组α⃗1,α⃗2,⋯ ,α⃗m\vec{\alpha}_1, \vec{\alpha}_2, \cdots, \vec{\alpha}_mα1,α2,⋯,αm线性表示。
案例:设向量组α⃗1 =[11]\vec{\alpha}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}α1 =[11],α⃗2 =[22]\vec{\alpha}_2 \ = \begin{bmatrix}2\\2\end{bmatrix}α2 =[22],β⃗ =[33]\vec{\beta} \ = \begin{bmatrix}3\\3\end{bmatrix}β =[33]。判断β⃗\vec{\beta}β能否由α⃗1,α⃗2\vec{\alpha}_1, \vec{\alpha}_2α1,α2线性表示。
从线性方程组角度,设β⃗ =xα⃗1+yα⃗2\vec{\beta} \ = x\vec{\alpha}_1 + y\vec{\alpha}_2β =xα1+yα2,即[33] =x[11]+y[22]\begin{bmatrix}3\\3\end{bmatrix} \ = x\begin{bmatrix}1\\1\end{bmatrix} + y\begin{bmatrix}2\\2\end{bmatrix}[33] =x[11]+y[22],可化为方程组{x+2y =3x+2y =3\begin{cases}x + 2y \ = 3 \\ x + 2y \ = 3\end{cases}{x+2y =3x+2y =3。
计算向量组α⃗1,α⃗2\vec{\alpha}_1, \vec{\alpha}_2α1,α2构成的矩阵A =[1212]A \ = \begin{bmatrix}1&2\\1&2\end{bmatrix}A =[1122]的秩r(A)r(A)r(A),通过初等行变换得到[1200]\begin{bmatrix}1&2\\0&0\end{bmatrix}[1020],r(A) =1r(A)\ =1r(A) =1。
增广矩阵(A∣β⃗) =[123123](A|\vec{\beta}) \ = \begin{bmatrix}1&2&3\\1&2&3\end{bmatrix}(A∣β) =[112233],经初等行变换为[123000]\begin{bmatrix}1&2&3\\0&0&0\end{bmatrix}[102030],秩r(A∣β⃗) =1r(A|\vec{\beta}) \ = 1r(A∣β) =1。
因为r(A) =r(A∣β⃗) =1r(A)\ =r(A|\vec{\beta}) \ = 1r(A) =r(A∣β) =1,所以方程组有解,β⃗\vec{\beta}β能由α⃗1,α⃗2\vec{\alpha}_1, \vec{\alpha}_2α1,α2线性表示,且β⃗ =3α⃗1+0α⃗2\vec{\beta} \ = 3\vec{\alpha}_1 + 0\vec{\alpha}_2β =3α1+0α2。
(二)求解线性表示表达式
教程:
- 将向量组α⃗1,α⃗2,⋯ ,α⃗m\vec{\alpha}_1, \vec{\alpha}_2, \cdots, \vec{\alpha}_mα1,α2,⋯,αm构成系数矩阵AAA,向量β⃗\vec{\beta}β构成增广矩阵(A∣β⃗)(A|\vec{\beta})(A∣β)。
- 对增广矩阵进行初等行变换化为行最简形矩阵。
- 从行最简形矩阵读取线性表示的系数。
案例:向量组α⃗1 =[12]\vec{\alpha}_1 \ = \begin{bmatrix}1\\2\end{bmatrix}α1 =[12],α⃗2 =[23]\vec{\alpha}_2 \ = \begin{bmatrix}2\\3\end{bmatrix}α2 =[23],β⃗ =[34]\vec{\beta} \ = \begin{bmatrix}3\\4\end{bmatrix}β =[34]。
构建增广矩阵[123234]\begin{bmatrix}1&2&3\\2&3&4\end{bmatrix}[122334]。
进行初等行变换:
- 第二行减去第一行的 2 倍,得[1230−1−2]\begin{bmatrix}1&2&3\\0& - 1& - 2\end{bmatrix}[102−13−2]。
- 第二行乘以 - 1,得[123012]\begin{bmatrix}1&2&3\\0&1&2\end{bmatrix}[102132]。
- 第一行减去第二行的 2 倍,得[10−1012]\begin{bmatrix}1&0& - 1\\0&1&2\end{bmatrix}[1001−12]。
所以β⃗ =−1α⃗1+2α⃗2\vec{\beta} \ = - 1\vec{\alpha}_1 + 2\vec{\alpha}_2β =−1α1+2α2。
三、向量组之间的关系
(一)相互线性表示
设有向量组(I):α⃗1,α⃗2(I): \vec{\alpha}_1, \vec{\alpha}_2(I):α1,α2及向量组(II):β⃗1,β⃗2(II): \vec{\beta}_1, \vec{\beta}_2(II):β1,β2。若向量组(II)(II)(II)中每个向量都能由向量组(I)(I)(I)线性表示,如β⃗1 =x1α⃗1+y1α⃗2\vec{\beta}_1 \ = x_1\vec{\alpha}_1 + y_1\vec{\alpha}_2β1 =x1α1+y1α2,β⃗2 =x2α⃗1+y2α⃗2\vec{\beta}_2 \ = x_2\vec{\alpha}_1 + y_2\vec{\alpha}_2β2 =x2α1+y2α2,则称向量组(II)(II)(II)能由向量组(I)(I)(I)线性表示。
(二)向量组等价
定义:若向量组(I)(I)(I)与向量组(II)(II)(II)可以相互线性表示,则称这两个向量组等价。
判定:
- 充要条件是r(I) =r(II) =r(I,II)r(I) \ = r(II) \ = r(I, II)r(I) =r(II) =r(I,II)。
- 若向量组(I)(I)(I)可由向量组(II)(II)(II)线性表示且r(I) =r(II)r(I) \ = r(II)r(I) =r(II),则两个向量组等价。
案例:向量组(I):α⃗1 =[10](I): \vec{\alpha}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}(I):α1 =[10],α⃗2 =[01]\vec{\alpha}_2 \ = \begin{bmatrix}0\\1\end{bmatrix}α2 =[01];向量组(II):β⃗1 =[11](II): \vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}(II):β1 =[11],β⃗2 =[22]\vec{\beta}_2 \ = \begin{bmatrix}2\\2\end{bmatrix}β2 =[22]。
向量组(I)(I)(I)的秩r(I) =2r(I)\ =2r(I) =2。
β⃗1 =α⃗1+α⃗2\vec{\beta}_1 \ = \vec{\alpha}_1 + \vec{\alpha}_2β1 =α1+α2,β⃗2 =2α⃗1+2α⃗2\vec{\beta}_2 \ = 2\vec{\alpha}_1 + 2\vec{\alpha}_2β2 =2α1+2α2,所以向量组(II)(II)(II)能由向量组(I)(I)(I)线性表示。
将向量组合并为(I,II):α⃗1,α⃗2,β⃗1,β⃗2(I, II): \vec{\alpha}_1, \vec{\alpha}_2, \vec{\beta}_1, \vec{\beta}_2(I,II):α1,α2,β1,β2,其秩r(I,II) =2r(I, II)\ =2r(I,II) =2。
α⃗1 =β⃗1−α⃗2\vec{\alpha}_1 \ = \vec{\beta}_1 - \vec{\alpha}_2α1 =β1−α2(这里α⃗2\vec{\alpha}_2α2可由β⃗1\vec{\beta}_1β1和α⃗1\vec{\alpha}_1α1表示,且α⃗1\vec{\alpha}_1α1本身存在),α⃗2 =β⃗1−α⃗1\vec{\alpha}_2 \ = \vec{\beta}_1 - \vec{\alpha}_1α2 =β1−α1,所以向量组(I)(I)(I)能由向量组(II)(II)(II)线性表示,且r(II) =2r(II)\ =2r(II) =2,满足r(I) =r(II) =r(I,II)r(I) \ = r(II) \ = r(I, II)r(I) =r(II) =r(I,II),两个向量组等价。
(三)相关结论
1. 被表示的秩不大
设向量组(I) ={α⃗1 =[10]}(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}\right\}(I) ={α1 =[10]},这是一个一维向量组,其秩r(I) =1r(I)\ =1r(I) =1。
向量组(II) ={β⃗1 =[10],β⃗2 =[01]}(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\0\end{bmatrix}, \vec{\beta}_2 \ = \begin{bmatrix}0\\1\end{bmatrix}\right\}(II) ={β1 =[10],β2 =[01]},这是一个二维向量组,其秩r(II) =2r(II)\ =2r(II) =2。
可以发现向量组(I)(I)(I)中的向量α⃗1\vec{\alpha}_1α1能由向量组(II)(II)(II)中的向量表示,即α⃗1 =1×β⃗1+0×β⃗2\vec{\alpha}_1 \ = 1\times\vec{\beta}_1 + 0\times\vec{\beta}_2α1 =1×β1+0×β2,满足向量组(I)(I)(I)可由向量组(II)(II)(II)表示。同时,r(I) =1≤r(II) =2r(I)\ =1\leq r(II)\ =2r(I) =1≤r(II) =2,验证了“被表示的秩不大”这一结论。
2. 被表示的可丢掉
设向量组(I) ={α⃗1 =[22]}(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}2\\2\end{bmatrix}\right\}(I) ={α1 =[22]},向量组(II) ={β⃗1 =[11]}(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}\right\}(II) ={β1 =[11]}。
因为α⃗1 =2×β⃗1\vec{\alpha}_1 \ = 2\times\vec{\beta}_1α1 =2×β1,所以向量组(I)(I)(I)可由向量组(II)(II)(II)表示。
向量组(II)(II)(II)构成的矩阵为B =[11]B \ = \begin{bmatrix}1\\1\end{bmatrix}B =[11],其秩r(II) =1r(II)\ =1r(II) =1。
将向量组(I)(I)(I)和(II)(II)(II)合并得到向量组(II,I) ={β⃗1 =[11],α⃗1 =[22]}(II, I)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}, \vec{\alpha}_1 \ = \begin{bmatrix}2\\2\end{bmatrix}\right\}(II,I) ={β1 =[11],α1 =[22]},构成的矩阵C =[1212]C\ =\begin{bmatrix}1&2\\1&2\end{bmatrix}C =[1122],通过初等行变换可得[1200]\begin{bmatrix}1&2\\0&0\end{bmatrix}[1020],其秩r(II,I) =1r(II, I)\ =1r(II,I) =1。
所以r(II) =r(II,I) =1r(II)\ =r(II, I)\ =1r(II) =r(II,I) =1,说明了在向量组(I)(I)(I)可由向量组(II)(II)(II)表示时,r(II) =r(II,I)r(II) \ = r(II, I)r(II) =r(II,I),即被表示的可丢掉。
3. 但(II)(II)(II)不可由(I)(I)(I)表示时的秩关系
设向量组(I) ={α⃗1 =[100]}(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\0\\0\end{bmatrix}\right\}(I) =⎩
⎨
⎧α1 =
100
⎭
⎬
⎫,秩r(I) =1r(I)\ =1r(I) =1。
向量组(II) ={β⃗1 =[100],β⃗2 =[010]}(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\0\\0\end{bmatrix}, \vec{\beta}_2 \ = \begin{bmatrix}0\\1\\0\end{bmatrix}\right\}(II) =⎩
⎨
⎧β1 =
100
,β2 =
010
⎭
⎬
⎫,秩r(II) =2r(II)\ =2r(II) =2。
显然向量组(I)(I)(I)中的α⃗1\vec{\alpha}_1α1可由向量组(II)(II)(II)表示,α⃗1 =1×β⃗1+0×β⃗2\vec{\alpha}_1 \ = 1\times\vec{\beta}_1 + 0\times\vec{\beta}_2α1 =1×β1+0×β2。
但向量组(II)(II)(II)中的β⃗2\vec{\beta}_2β2无法由向量组(I)(I)(I)表示,因为仅α⃗1\vec{\alpha}_1α1无法组合出在yyy轴上有分量的向量。此时r(I) =1<r(II) =2r(I)\ =1< r(II)\ =2r(I) =1<r(II) =2,符合“若向量组(I)(I)(I)可由向量组(II)(II)(II)表示,但(II)(II)(II)不可由(I)(I)(I)表示,则r(I)<r(II)r(I) < r(II)r(I)<r(II)”这一结论。
4. 以少表多,多必相关
设向量组(I) ={α⃗1 =[11],α⃗2 =[22],α⃗3 =[33]}(I)\ =\left\{\vec{\alpha}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}, \vec{\alpha}_2 \ = \begin{bmatrix}2\\2\end{bmatrix}, \vec{\alpha}_3 \ = \begin{bmatrix}3\\3\end{bmatrix}\right\}(I) ={α1 =[11],α2 =[22],α3 =[33]},向量组(II) ={β⃗1 =[11]}(II)\ =\left\{\vec{\beta}_1 \ = \begin{bmatrix}1\\1\end{bmatrix}\right\}(II) ={β1 =[11]}。
可以看到α⃗1 =1×β⃗1\vec{\alpha}_1 \ = 1\times\vec{\beta}_1α1 =1×β1,α⃗2 =2×β⃗1\vec{\alpha}_2 \ = 2\times\vec{\beta}_1α2 =2×β1,α⃗3 =3×β⃗1\vec{\alpha}_3 \ = 3\times\vec{\beta}_1α3 =3×β1,即向量组(I)(I)(I)可由向量组(II)(II)(II)表示。
向量组(I)(I)(I)中有333个向量,向量组(II)(II)(II)中有111个向量,(I)(I)(I)中向量个数大于(II)(II)(II)中向量个数。
对于向量组(I)(I)(I),存在不全为零的数k1 =−3k_1\ =-3k1 =−3,k2 =3k_2 \ = 3k2 =3,k3 =−1k_3\ =-1k3 =−1,使得k1α⃗1+k2α⃗2+k3α⃗3 =[−3+6−3−3+6−3] =[00]k_1\vec{\alpha}_1 + k_2\vec{\alpha}_2 + k_3\vec{\alpha}_3\ =\begin{bmatrix}-3 + 6 - 3\\-3 + 6 - 3\end{bmatrix}\ =\begin{bmatrix}0\\0\end{bmatrix}k1α1+k2α2+k3α3 =[−3+6−3−3+6−3] =[00],满足线性相关的定义,所以向量组(I)(I)(I)一定线性相关,验证了“以少表多,多必相关”的结论。
更多推荐


所有评论(0)