线性代数
约 2740 个字 预计阅读时间 9 分钟
Note
来对大一上学的线代知识进行一个回顾和补充~ 线性代数甲学到矩阵的正定为止,这一页应该绝大部分都是课内知识。
线性方程组
齐次线性方程组
形如\(AX=0\) 1. 只有零解\(\Leftrightarrow r(A)=n\) 2. 有非零解\(\Leftrightarrow r(A)<n\)
非齐次线性方程组
形如\(AX=b\) 1. 无解\(\Leftrightarrow r(A)\neq r(\overline{A})\) 2. 有唯一解\(\Leftrightarrow r(A)=r(\overline{A})=n\) 3. 有无穷多解\(\Leftrightarrow r(A)=r(\overline{A})<n\)
行列式
计算方法
- 定义法,一般是二阶或者三阶
- 拉普拉斯展开
- 加边法
- 拆分法
- 递推法
一些结论
- 上线三角可以直接对角线元素相乘,反上下三角要乘一个系数\({-1}^{\frac{n(n-1)}{2}}\)
- \(\begin{vmatrix} A & B\\O &C \end{vmatrix}=|A||C|\),如果O在主对角线上要加系数\((-1)^{rs}\)
- 范德蒙德行列式 \(V = \begin{vmatrix} 1 & x_1 & x_1^2 & \cdots & x_1^{n-1} \\ 1 & x_2 & x_2^2 & \cdots & x_2^{n-1} \\ 1 & x_3 & x_3^2 & \cdots & x_3^{n-1} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_n & x_n^2 & \cdots & x_n^{n-1} \end{vmatrix}= \prod_{1 \leq i < j \leq n} (x_j - x_i)\)
- 爪形和么字形
克拉默法则
克拉默法则(Cramer's Rule)是一种用于解线性方程组的方法,适用于具有唯一解的线性方程组。克拉默法则主要利用行列式来求解方程组中的未知数。
假设我们有一个由 \(n\) 个方程组成的线性方程组,其标准形式为:
$ \begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \ \vdots \ a_{n1}x_1 + a_{n2}x_2 + \dots + a_{nn}x_n = b_n \end{cases} $
用矩阵形式表示为:
$ A \mathbf{x} = \mathbf{b} $
其中,\(A\) 是系数矩阵,\(\mathbf{x}\) 是未知数向量,\(\mathbf{b}\) 是常数向量。
克拉默法则指出,如果系数矩阵 \(A\) 的行列式 \(\text{det}(A) \neq 0\),那么该方程组的解可以通过以下公式得到:\(x_i = \frac{\text{det}(A_i)}{\text{det}(A)}\)
其中,\(A_i\) 是将系数矩阵 \(A\) 的第 \(i\) 列替换为常数向量 \(\mathbf{b}\) 后得到的矩阵,\(\text{det}(A)\) 和 \(\text{det}(A_i)\) 分别表示矩阵 \(A\) 和 \(A_i\) 的行列式。
矩阵
各种矩阵的符号
- 转置矩阵\(A^T\)
- 增广矩阵\(\overline{A}\)
- 伴随矩阵\(A^*\)
- 逆矩阵\(A^{-1}\)
各种特殊的矩阵
- 对角矩阵:\(diag(a_1,a_2,\dots,a_n)\)
- 幂等矩阵:\(A^2=A\)
- 对合矩阵:\(A^2=E\)
- 对称矩阵:\(A^T=A\)
- 反对称矩阵:\(A+A^T=diag\)
- 正交矩阵:\(A^T=A^{-1}\)
- 正定矩阵:\(X^TAX>0\)
- 稀疏矩阵:含有大量零元素的矩阵
- 严格对角占有阵:对角线上的元素比这一行或一列元素的和还大
一些常用的公式
- \(|kA|=k^n|A|\)
- \((AB)^T=B^TA^T\)
- \(A^*A=|A|E\)
- \((AB)^*=B^*A^*\)
- \((kA^*)=k^{n-1}A^*\)
- \((A^*)^*=|A|^{n-2}A\)
- \((AB)^{-1}=B^{-1}A^{-1}\)
- \((kA)^{-1}=\frac{1}{k}A^{-1}\)
- \(|A^{-1}|=|A|^{-1}\)
- \(|AB|=|A||B|\)
- 转置和求逆可以换顺序,伴随和求逆也可以换顺序
可逆判定及求解
- \(AB=E\)说明\(A\)和\(B\)都可逆,且互为逆矩阵
- \(\Leftrightarrow |A|\neq 0\qquad A^{-1}=\frac{1}{|A|}A^*\)
- 通过与单位矩阵写到一起初等变换求逆
矩阵相抵(等价)
定义
若\(A,B\in P^{m\times n}\),则\(A\)与\(B\)相抵\(\Leftrightarrow\)存在可逆矩阵\(P,Q\),有\(PAQ=B\Leftrightarrow r(A)=r(B)\)
等价标准型
若\(A\in P^{m\times n},r(A)=r\),则存在可逆矩阵\(P\in P^{m\times m},Q\in P^{n\times n}\),使得\(PAQ=\begin{bmatrix} Er&\\&O \end{bmatrix}\)
矩阵的秩
- \(r(A_{m\times n})\leq min(m,n)\)
- \(r(AB)\leq min(r(A),r(B))\)
- 乘可逆矩阵不改变秩
- \(r(\begin{bmatrix} A&\\&B \end{bmatrix})=r(A)+r(B)\)
- \(r(\begin{bmatrix} A&C\\&B \end{bmatrix})\geq r(A)+r(B)\)
- \(r(A+B)\leq r(A)+r(B)\)
- \(r(AB)\geq r(A)+r(B)-n\)
- \(r(ABC)\geq r(AB)+r(BC)-r(B)\)
- \(r([A B])\leq r(A)+r(B)\)
线性空间
定义
满足: 1. 一个非空集合 2. 两个封闭的运算 3. 八条运算规律
常见的线性空间
- \(P^n,R^n\)
- \(P^{m\times n}\)
- \(P[x]_n\)
- 对称区间上的定积分
线性表示
判断\(\beta\)是否可以用向量组\(\alpha_1,\alpha_2,...,\alpha_n\)线性表示,即判断方程组\(AX=\beta\)是否有解,可以等价替换为某个基下的坐标表示
线性相(无)关
判断向量组\(\alpha_1,\alpha_2,...,\alpha_n\)是否线性相关,即判断程组\(AX=O\)是否有非零解,同样可以等价替换为某个基下的坐标表示
极大线性无关组
是指在一个向量组中,具有线性无关性质的最大子集。组内的所有向量都是线性无关的,即没有任何一个向量可以表示为其他向量的线性组合。一旦加入新的向量,这个组就会失去线性无关性。
基与维数
基
在向量空间中,基 是一组向量,这组向量具有以下两个性质: 1. 线性无关性:基中的任何一个向量都不能由其他向量的线性组合表示。 2. 张成性:基中的向量可以通过线性组合生成整个向量空间中的任意一个向量。
简单来说,基是生成整个向量空间的最小向量集。基的选择并不唯一,不同的基可以生成同一个向量空间。
维数
维数 是描述向量空间大小的一个重要量。具体来说,维数是一个向量空间中任意一组基的向量个数。由于向量空间的基具有线性无关性和张成性,因此所有基的向量个数是相同的,进而维数是向量空间的一个不变性质。
坐标
\(\alpha=[\epsilon_1,\epsilon_2,...,\epsilon_n][x_1,\dots,x_n]^T\)
基Ⅰ\(\epsilon_1,\epsilon_2,...,\epsilon_n\)到基Ⅱ\(\eta_1,\eta_2,...,\eta_n\)的过渡矩阵为M: * 基变换公式:\([\epsilon_1,\epsilon_2,...,\epsilon_n]=[\eta_1,\eta_2,...,\eta_n]M\) * 坐标变换公式:\(X=MY,Y=M^{-1}X\)
这些概念在多项式空间、函数空间、矩阵空间等更抽象的向量空间中也有广泛应用。
欧式空间
定义
n维欧式空间是定义了内积的线性空间,可以表示为\(\mathbb{R}^n\),其中n是正整数。\(\mathbb{R}^n\)表示所有n元有序实数数组(即向量)的集合。
在欧式空间中,有几个关键的性质: 1. 内积:欧式空间中的向量之间可以定义内积(也叫点积),例如在二维或三维空间中,向量\(\mathbf{u}\)和\(\mathbf{v}\)的内积定义为\(\mathbf{u} \cdot \mathbf{v} = u_1v_1 + u_2v_2 + \dots + u_nv_n\)。
-
距离:任意两个点之间的距离可以用内积定义。例如,欧式距离\(d(\mathbf{u}, \mathbf{v})\)可以表示为\(d(\mathbf{u}, \mathbf{v}) = \sqrt{(\mathbf{u} - \mathbf{v}) \cdot (\mathbf{u} - \mathbf{v})}\)。
-
正交性:当两个向量的内积为零时,这两个向量被称为正交的。在二维和三维空间中,正交向量对应于互相垂直的向量。
施密特正交化
标准正交基指的是在向量空间中,所有向量都相互正交(即两两垂直),且每个向量的长度为1的基底集合。
施密特正交化(Gram-Schmidt 正交化)是一种将一组线性无关的向量转换为一组标准正交基的方法。这个过程通过逐步正交化和标准化来构造一组新的向量,使得它们相互正交且每个向量的长度为1。
假设我们有一组线性无关的向量 \(\{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n\}\),施密特正交化的步骤如下:
-
初始化:令第一个标准正交基向量 \(\mathbf{u}_1\) 等于原向量 \(\mathbf{v}_1\): \(\mathbf{u}_1 = \mathbf{v}_1\) 然后将其标准化得到第一个正交基向量 \(\mathbf{e}_1\): \(\mathbf{e}_1 = \frac{\mathbf{u}_1}{\|\mathbf{u}_1\|}\)
-
迭代正交化:对每个后续的向量 \(\mathbf{v}_k\)(\(k = 2, 3, \dots, n\)),首先从原向量中减去其在先前所有已构造的正交基向量上的投影: \(\mathbf{u}_k = \mathbf{v}_k - \sum_{i=1}^{k-1} \text{proj}_{\mathbf{e}_i}(\mathbf{v}_k)\) 其中,投影的计算公式为: \(\text{proj}_{\mathbf{e}_i}(\mathbf{v}_k) = \frac{\mathbf{v}_k \cdot \mathbf{e}_i}{\mathbf{e}_i \cdot \mathbf{e}_i} \mathbf{e}_i = (\mathbf{v}_k \cdot \mathbf{e}_i)\mathbf{e}_i\) 然后,将正交化后的向量标准化得到新的正交基向量: \(\mathbf{e}_k = \frac{\mathbf{u}_k}{\|\mathbf{u}_k\|}\)
-
结果:经过上述步骤,最终得到的向量组 \(\{\mathbf{e}_1, \mathbf{e}_2, \dots, \mathbf{e}_n\}\) 是原向量组的标准正交基。
正交矩阵
正交矩阵是指行向量或列向量互相正交且均为单位向量的方阵。对于一个n阶正交矩阵\(Q\),它满足以下条件:
-
矩阵乘积性质: \(Q^T Q = Q Q^T = E\) 其中\(Q^T\)是矩阵\(Q\)的转置,\(E\)是n阶单位矩阵。这意味着正交矩阵的逆矩阵等于它的转置,即: \(Q^{-1} = Q^T\)
-
保持向量的长度:对于任何向量\(x\),正交矩阵\(Q\)都保持\(x\)的欧几里得长度,即: \(\| Qx \| = \| x \|\) 这说明正交矩阵对应的线性变换是一个等距变换(例如旋转或反射)。
-
列向量和行向量的正交性:
- 矩阵\(Q\)的任意两列向量(或行向量)都是互相正交的,即它们的点积为零。
- 每个列向量(或行向量)的长度为1。
相似对角化
特征值和特征向量
矩阵的特征值\(\lambda\)满足\(A\xi=\lambda\xi(\xi\neq 0)\),特征值是特征方程\(f(\lambda)=|\lambda E-A|=0\)的根,求特征向量只需要求\((\lambda E-A)X=O\)不为零的通解。
特征向量满足以下性质: * \(\lambda_1+\dots+\lambda_n=tr(A)\) * \(\lambda_1\dots\lambda_n=|A|\) * \(\lambda^k\)是\(A^k\)的特征值,\(k=-1,0,1\dots\) * A的特征值(含重数)和特征向量也一定g(A)的特征值(含重数)的特征值和特征向量,但反过来就不一定了
矩阵的相似
- 定义:\(P^{-1}AP=B\)
- 性质:A与B相似\(\Rightarrow\quad r(A)=r(B),|A|=|B|,tr(A)=tr(B)\),\(A^k\)与\(B^k\)相似,g(A)与g(B)相似
- 判断方法:若A,B均能对角化,则:A与B相似\(\Leftrightarrow |\lambda E-A|=|\lambda E-B|\)
矩阵的对角化
- 判断方法:
- 充要条件为n个线性无关的特征向量
- 若有n个不同的特征值,则可对角化
- 特征值重数与属于该特征值的特征向量个数相等
- 对角化方法:求特征值和特征向量\(P^{-1}AP=\Lambda\)
- 作用:\(A^k=P\Lambda^k P^{-1},f(A)=Pf(\Lambda)P^{-1}\)
- 是对称矩阵一定可以相似对角化\(U^{-1}AU=\Lambda\quad(U^{-1})=U^T\)
二次型
配方法
用配方法化二次型为标准型,可能涉及到换元
正交线性替换
定义
假设我们有一个 \(n\) 维向量 \(\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}\),如果存在一个 \(n \times n\) 的正交矩阵 \(P\),使得新的变量 \(\mathbf{y} = \begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{bmatrix}\) 可以表示为:
\(\mathbf{y} = P^T \mathbf{x}\)
那么这个变换就被称为正交线性替换。因为 \(P\) 是正交矩阵,所以它满足 \(P^T P = I\),即它的转置矩阵等于其逆矩阵。
在二次型中的应用
在二次型 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\) 中,使用正交线性替换可以将二次型化为对角形式。这意味着通过适当的正交线性替换,可以将原来的二次型化简为一组不相关的新变量之和:
\(Q(\mathbf{x}) = \mathbf{y}^T D \mathbf{y}\)
其中 \(D\) 是一个对角矩阵,矩阵 \(D\) 的对角元素即为原来矩阵 \(A\) 的特征值。这个过程在二次型的标准化、研究二次型的正定性或半正定性,以及计算二次型的值等方面非常有用。
二次型的规范型
实数域上二次型的规范型为:\(z_1^2+z_2^2+\dots+z_p^2-z_{p+1}^2-\dots-z_r^2\)
相关量的定义如下: * 正惯性指数:p * 负惯性指数:r-p * 符号差:2p-r
矩阵的合同
- 定义:\(C^TAC=B,|C|\neq 0\)
- 性质:\(r(A)=r(B)\)
- 判断:
- 实对称矩阵A和B合同\(\Leftrightarrow\)r(A)=r(B)且正惯性指数相同
- 若A是正定矩阵且B是与A阶数相同的对称矩阵,则A与B合同\(\Leftrightarrow\)B是正定矩阵
- 若A与B是相似的是对称矩阵,则A与B在实数域上合同
- 标准型:\(C^TAC=\begin{bmatrix} E_p&O&O\\O&-E_{r-p}&O\\O&O&O \end{bmatrix}\)
矩阵的正定
定义
-
对称性:矩阵 \(A\) 必须是对称矩阵,即 \(A = A^T\)。
-
正定性:对于任何非零向量 \(x\),都有 \(x^T A x > 0\)。
判别
- 矩阵的特征值全部为正。
- 矩阵的顺序主子式全部大于0
- 正惯性指数=n
- 存在n阶实可逆矩阵B,使\(A=B^TB\)
- 与n阶单位矩阵合同
性质
- 若 \(A\) 是正定矩阵,则 \(A\) 是可逆的,且 \(A^{-1}\) 也是正定矩阵。
- \(A^k\)正定,k为任意正整数