线性代数

约 2740 个字预计阅读时间 9 分钟

Note

来对大一上学的线代知识进行一个回顾和补充~ 线性代数甲学到矩阵的正定为止，这一页应该绝大部分都是课内知识。

线性方程组

齐次线性方程组

形如$AX=0$ 1. 只有零解$\Leftrightarrow r(A)=n$ 2. 有非零解$\Leftrightarrow r(A)<n$

非齐次线性方程组

形如$AX=b$ 1. 无解$\Leftrightarrow r(A)\neq r(\overline{A})$ 2. 有唯一解$\Leftrightarrow r(A)=r(\overline{A})=n$ 3. 有无穷多解$\Leftrightarrow r(A)=r(\overline{A})<n$

行列式

计算方法

定义法，一般是二阶或者三阶
拉普拉斯展开
加边法
拆分法
递推法

一些结论

上线三角可以直接对角线元素相乘，反上下三角要乘一个系数${-1}^{\frac{n(n-1)}{2}}$
$\begin{vmatrix} A & B\\O &C \end{vmatrix}=|A||C|$,如果O在主对角线上要加系数$(-1)^{rs}$
范德蒙德行列式 $V = \begin{vmatrix} 1 & x_1 & x_1^2 & \cdots & x_1^{n-1} \\ 1 & x_2 & x_2^2 & \cdots & x_2^{n-1} \\ 1 & x_3 & x_3^2 & \cdots & x_3^{n-1} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_n & x_n^2 & \cdots & x_n^{n-1} \end{vmatrix}= \prod_{1 \leq i < j \leq n} (x_j - x_i)$
爪形和么字形

克拉默法则

克拉默法则（Cramer's Rule）是一种用于解线性方程组的方法，适用于具有唯一解的线性方程组。克拉默法则主要利用行列式来求解方程组中的未知数。

假设我们有一个由 $n$ 个方程组成的线性方程组，其标准形式为：

$ \begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \ \vdots \ a_{n1}x_1 + a_{n2}x_2 + \dots + a_{nn}x_n = b_n \end{cases} $

用矩阵形式表示为：

$ A \mathbf{x} = \mathbf{b} $

其中，$A$ 是系数矩阵，$\mathbf{x}$ 是未知数向量，$\mathbf{b}$ 是常数向量。

克拉默法则指出，如果系数矩阵 $A$ 的行列式 $\text{det}(A) \neq 0$，那么该方程组的解可以通过以下公式得到：$x_i = \frac{\text{det}(A_i)}{\text{det}(A)}$

其中，$A_i$ 是将系数矩阵 $A$ 的第 $i$ 列替换为常数向量 $\mathbf{b}$ 后得到的矩阵，$\text{det}(A)$ 和 $\text{det}(A_i)$ 分别表示矩阵 $A$ 和 $A_i$ 的行列式。

矩阵

各种矩阵的符号

转置矩阵$A^T$
增广矩阵$\overline{A}$
伴随矩阵$A^*$
逆矩阵$A^{-1}$

各种特殊的矩阵

对角矩阵：$diag(a_1,a_2,\dots,a_n)$
幂等矩阵：$A^2=A$
对合矩阵：$A^2=E$
对称矩阵：$A^T=A$
反对称矩阵：$A+A^T=diag$
正交矩阵：$A^T=A^{-1}$
正定矩阵：$X^TAX>0$
稀疏矩阵：含有大量零元素的矩阵
严格对角占有阵：对角线上的元素比这一行或一列元素的和还大

一些常用的公式

$|kA|=k^n|A|$
$(AB)^T=B^TA^T$
$A^*A=|A|E$
$(AB)^*=B^*A^*$
$(kA^*)=k^{n-1}A^*$
$(A^*)^*=|A|^{n-2}A$
$(AB)^{-1}=B^{-1}A^{-1}$
$(kA)^{-1}=\frac{1}{k}A^{-1}$
$|A^{-1}|=|A|^{-1}$
$|AB|=|A||B|$
转置和求逆可以换顺序，伴随和求逆也可以换顺序

可逆判定及求解

$AB=E$说明$A$和$B$都可逆，且互为逆矩阵
$\Leftrightarrow |A|\neq 0\qquad A^{-1}=\frac{1}{|A|}A^*$
通过与单位矩阵写到一起初等变换求逆

矩阵相抵(等价)

定义

若$A,B\in P^{m\times n}$，则$A$与$B$相抵$\Leftrightarrow$存在可逆矩阵$P,Q$，有$PAQ=B\Leftrightarrow r(A)=r(B)$

等价标准型

若$A\in P^{m\times n},r(A)=r$，则存在可逆矩阵$P\in P^{m\times m},Q\in P^{n\times n}$，使得$PAQ=\begin{bmatrix} Er&\\&O \end{bmatrix}$

矩阵的秩

$r(A_{m\times n})\leq min(m,n)$
$r(AB)\leq min(r(A),r(B))$
乘可逆矩阵不改变秩
$r(\begin{bmatrix} A&\\&B \end{bmatrix})=r(A)+r(B)$
$r(\begin{bmatrix} A&C\\&B \end{bmatrix})\geq r(A)+r(B)$
$r(A+B)\leq r(A)+r(B)$
$r(AB)\geq r(A)+r(B)-n$
$r(ABC)\geq r(AB)+r(BC)-r(B)$
$r([A B])\leq r(A)+r(B)$

线性空间

定义

满足： 1. 一个非空集合 2. 两个封闭的运算 3. 八条运算规律

常见的线性空间

$P^n,R^n$
$P^{m\times n}$
$P[x]_n$
对称区间上的定积分

线性表示

判断$\beta$是否可以用向量组$\alpha_1,\alpha_2,...,\alpha_n$线性表示，即判断方程组$AX=\beta$是否有解，可以等价替换为某个基下的坐标表示

线性相(无)关

判断向量组$\alpha_1,\alpha_2,...,\alpha_n$是否线性相关，即判断程组$AX=O$是否有非零解，同样可以等价替换为某个基下的坐标表示

极大线性无关组

是指在一个向量组中，具有线性无关性质的最大子集。组内的所有向量都是线性无关的，即没有任何一个向量可以表示为其他向量的线性组合。一旦加入新的向量，这个组就会失去线性无关性。

基与维数

基

在向量空间中，基是一组向量，这组向量具有以下两个性质： 1. 线性无关性：基中的任何一个向量都不能由其他向量的线性组合表示。 2. 张成性：基中的向量可以通过线性组合生成整个向量空间中的任意一个向量。

简单来说，基是生成整个向量空间的最小向量集。基的选择并不唯一，不同的基可以生成同一个向量空间。

维数

维数是描述向量空间大小的一个重要量。具体来说，维数是一个向量空间中任意一组基的向量个数。由于向量空间的基具有线性无关性和张成性，因此所有基的向量个数是相同的，进而维数是向量空间的一个不变性质。

坐标

$\alpha=[\epsilon_1,\epsilon_2,...,\epsilon_n][x_1,\dots,x_n]^T$

基Ⅰ$\epsilon_1,\epsilon_2,...,\epsilon_n$到基Ⅱ$\eta_1,\eta_2,...,\eta_n$的过渡矩阵为M： * 基变换公式：$[\epsilon_1,\epsilon_2,...,\epsilon_n]=[\eta_1,\eta_2,...,\eta_n]M$ * 坐标变换公式：$X=MY,Y=M^{-1}X$

这些概念在多项式空间、函数空间、矩阵空间等更抽象的向量空间中也有广泛应用。

欧式空间

定义

n维欧式空间是定义了内积的线性空间，可以表示为$\mathbb{R}^n$，其中n是正整数。$\mathbb{R}^n$表示所有n元有序实数数组（即向量）的集合。

在欧式空间中，有几个关键的性质： 1. 内积：欧式空间中的向量之间可以定义内积（也叫点积），例如在二维或三维空间中，向量$\mathbf{u}$和$\mathbf{v}$的内积定义为$\mathbf{u} \cdot \mathbf{v} = u_1v_1 + u_2v_2 + \dots + u_nv_n$。

距离：任意两个点之间的距离可以用内积定义。例如，欧式距离$d(\mathbf{u}, \mathbf{v})$可以表示为$d(\mathbf{u}, \mathbf{v}) = \sqrt{(\mathbf{u} - \mathbf{v}) \cdot (\mathbf{u} - \mathbf{v})}$。
正交性：当两个向量的内积为零时，这两个向量被称为正交的。在二维和三维空间中，正交向量对应于互相垂直的向量。

施密特正交化

标准正交基指的是在向量空间中，所有向量都相互正交（即两两垂直），且每个向量的长度为1的基底集合。

施密特正交化（Gram-Schmidt 正交化）是一种将一组线性无关的向量转换为一组标准正交基的方法。这个过程通过逐步正交化和标准化来构造一组新的向量，使得它们相互正交且每个向量的长度为1。

假设我们有一组线性无关的向量 $\{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n\}$，施密特正交化的步骤如下：

初始化：令第一个标准正交基向量 $\mathbf{u}_1$ 等于原向量 $\mathbf{v}_1$： $\mathbf{u}_1 = \mathbf{v}_1$ 然后将其标准化得到第一个正交基向量 $\mathbf{e}_1$： $\mathbf{e}_1 = \frac{\mathbf{u}_1}{\|\mathbf{u}_1\|}$
迭代正交化：对每个后续的向量 $\mathbf{v}_k$（$k = 2, 3, \dots, n$），首先从原向量中减去其在先前所有已构造的正交基向量上的投影： $\mathbf{u}_k = \mathbf{v}_k - \sum_{i=1}^{k-1} \text{proj}_{\mathbf{e}_i}(\mathbf{v}_k)$ 其中，投影的计算公式为： $\text{proj}_{\mathbf{e}_i}(\mathbf{v}_k) = \frac{\mathbf{v}_k \cdot \mathbf{e}_i}{\mathbf{e}_i \cdot \mathbf{e}_i} \mathbf{e}_i = (\mathbf{v}_k \cdot \mathbf{e}_i)\mathbf{e}_i$ 然后，将正交化后的向量标准化得到新的正交基向量： $\mathbf{e}_k = \frac{\mathbf{u}_k}{\|\mathbf{u}_k\|}$
结果：经过上述步骤，最终得到的向量组 $\{\mathbf{e}_1, \mathbf{e}_2, \dots, \mathbf{e}_n\}$ 是原向量组的标准正交基。

正交矩阵

正交矩阵是指行向量或列向量互相正交且均为单位向量的方阵。对于一个n阶正交矩阵$Q$，它满足以下条件：

矩阵乘积性质： $Q^T Q = Q Q^T = E$ 其中$Q^T$是矩阵$Q$的转置，$E$是n阶单位矩阵。这意味着正交矩阵的逆矩阵等于它的转置，即： $Q^{-1} = Q^T$
保持向量的长度：对于任何向量$x$，正交矩阵$Q$都保持$x$的欧几里得长度，即： $\| Qx \| = \| x \|$ 这说明正交矩阵对应的线性变换是一个等距变换（例如旋转或反射）。
列向量和行向量的正交性：
矩阵$Q$的任意两列向量（或行向量）都是互相正交的，即它们的点积为零。
每个列向量（或行向量）的长度为1。

相似对角化

特征值和特征向量

矩阵的特征值$\lambda$满足$A\xi=\lambda\xi(\xi\neq 0)$,特征值是特征方程$f(\lambda)=|\lambda E-A|=0$的根，求特征向量只需要求$(\lambda E-A)X=O$不为零的通解。

特征向量满足以下性质： * $\lambda_1+\dots+\lambda_n=tr(A)$ * $\lambda_1\dots\lambda_n=|A|$ * $\lambda^k$是$A^k$的特征值，$k=-1,0,1\dots$ * A的特征值(含重数)和特征向量也一定g(A)的特征值(含重数)的特征值和特征向量，但反过来就不一定了

矩阵的相似

定义：$P^{-1}AP=B$
性质：A与B相似$\Rightarrow\quad r(A)=r(B),|A|=|B|,tr(A)=tr(B)$,$A^k$与$B^k$相似，g(A)与g(B)相似
判断方法：若A,B均能对角化，则：A与B相似$\Leftrightarrow |\lambda E-A|=|\lambda E-B|$

矩阵的对角化

判断方法：
充要条件为n个线性无关的特征向量
若有n个不同的特征值，则可对角化
特征值重数与属于该特征值的特征向量个数相等
对角化方法：求特征值和特征向量$P^{-1}AP=\Lambda$
作用：$A^k=P\Lambda^k P^{-1},f(A)=Pf(\Lambda)P^{-1}$
是对称矩阵一定可以相似对角化$U^{-1}AU=\Lambda\quad(U^{-1})=U^T$

二次型

配方法

用配方法化二次型为标准型，可能涉及到换元

正交线性替换

定义

假设我们有一个 $n$ 维向量 $\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}$，如果存在一个 $n \times n$ 的正交矩阵 $P$，使得新的变量 $\mathbf{y} = \begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{bmatrix}$ 可以表示为：

$\mathbf{y} = P^T \mathbf{x}$

那么这个变换就被称为正交线性替换。因为 $P$ 是正交矩阵，所以它满足 $P^T P = I$，即它的转置矩阵等于其逆矩阵。

在二次型中的应用

在二次型 $Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}$ 中，使用正交线性替换可以将二次型化为对角形式。这意味着通过适当的正交线性替换，可以将原来的二次型化简为一组不相关的新变量之和：

$Q(\mathbf{x}) = \mathbf{y}^T D \mathbf{y}$

其中 $D$ 是一个对角矩阵，矩阵 $D$ 的对角元素即为原来矩阵 $A$ 的特征值。这个过程在二次型的标准化、研究二次型的正定性或半正定性，以及计算二次型的值等方面非常有用。

二次型的规范型

实数域上二次型的规范型为：$z_1^2+z_2^2+\dots+z_p^2-z_{p+1}^2-\dots-z_r^2$

相关量的定义如下： * 正惯性指数：p * 负惯性指数：r-p * 符号差：2p-r

矩阵的合同

定义：$C^TAC=B,|C|\neq 0$
性质：$r(A)=r(B)$
判断：
实对称矩阵A和B合同$\Leftrightarrow$r(A)=r(B)且正惯性指数相同
若A是正定矩阵且B是与A阶数相同的对称矩阵，则A与B合同$\Leftrightarrow$B是正定矩阵
若A与B是相似的是对称矩阵，则A与B在实数域上合同
标准型：$C^TAC=\begin{bmatrix} E_p&O&O\\O&-E_{r-p}&O\\O&O&O \end{bmatrix}$

矩阵的正定

定义

对称性：矩阵 $A$ 必须是对称矩阵，即 $A = A^T$。
正定性：对于任何非零向量 $x$，都有 $x^T A x > 0$。

判别

矩阵的特征值全部为正。
矩阵的顺序主子式全部大于0
正惯性指数=n
存在n阶实可逆矩阵B，使$A=B^TB$
与n阶单位矩阵合同

性质

若 $A$ 是正定矩阵，则 $A$ 是可逆的，且 $A^{-1}$ 也是正定矩阵。
$A^k$正定，k为任意正整数