Skip to content

线性代数

约 2740 个字 预计阅读时间 9 分钟

Note

来对大一上学的线代知识进行一个回顾和补充~ 线性代数甲学到矩阵的正定为止,这一页应该绝大部分都是课内知识。

线性方程组

齐次线性方程组

形如\(AX=0\) 1. 只有零解\(\Leftrightarrow r(A)=n\) 2. 有非零解\(\Leftrightarrow r(A)<n\)

非齐次线性方程组

形如\(AX=b\) 1. 无解\(\Leftrightarrow r(A)\neq r(\overline{A})\) 2. 有唯一解\(\Leftrightarrow r(A)=r(\overline{A})=n\) 3. 有无穷多解\(\Leftrightarrow r(A)=r(\overline{A})<n\)

行列式

计算方法

  1. 定义法,一般是二阶或者三阶
  2. 拉普拉斯展开
  3. 加边法
  4. 拆分法
  5. 递推法

一些结论

  • 上线三角可以直接对角线元素相乘,反上下三角要乘一个系数\({-1}^{\frac{n(n-1)}{2}}\)
  • \(\begin{vmatrix} A & B\\O &C \end{vmatrix}=|A||C|\),如果O在主对角线上要加系数\((-1)^{rs}\)
  • 范德蒙德行列式 \(V = \begin{vmatrix} 1 & x_1 & x_1^2 & \cdots & x_1^{n-1} \\ 1 & x_2 & x_2^2 & \cdots & x_2^{n-1} \\ 1 & x_3 & x_3^2 & \cdots & x_3^{n-1} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_n & x_n^2 & \cdots & x_n^{n-1} \end{vmatrix}= \prod_{1 \leq i < j \leq n} (x_j - x_i)\)
  • 爪形和么字形

克拉默法则

克拉默法则(Cramer's Rule)是一种用于解线性方程组的方法,适用于具有唯一解的线性方程组。克拉默法则主要利用行列式来求解方程组中的未知数。

假设我们有一个由 \(n\) 个方程组成的线性方程组,其标准形式为:

$ \begin{cases} a_{11}x_1 + a_{12}x_2 + \dots + a_{1n}x_n = b_1 \ a_{21}x_1 + a_{22}x_2 + \dots + a_{2n}x_n = b_2 \ \vdots \ a_{n1}x_1 + a_{n2}x_2 + \dots + a_{nn}x_n = b_n \end{cases} $

用矩阵形式表示为:

$ A \mathbf{x} = \mathbf{b} $

其中,\(A\) 是系数矩阵,\(\mathbf{x}\) 是未知数向量,\(\mathbf{b}\) 是常数向量。

克拉默法则指出,如果系数矩阵 \(A\) 的行列式 \(\text{det}(A) \neq 0\),那么该方程组的解可以通过以下公式得到:\(x_i = \frac{\text{det}(A_i)}{\text{det}(A)}\)

其中,\(A_i\) 是将系数矩阵 \(A\) 的第 \(i\) 列替换为常数向量 \(\mathbf{b}\) 后得到的矩阵,\(\text{det}(A)\)\(\text{det}(A_i)\) 分别表示矩阵 \(A\)\(A_i\) 的行列式。

矩阵

各种矩阵的符号

  • 转置矩阵\(A^T\)
  • 增广矩阵\(\overline{A}\)
  • 伴随矩阵\(A^*\)
  • 逆矩阵\(A^{-1}\)

各种特殊的矩阵

  • 对角矩阵:\(diag(a_1,a_2,\dots,a_n)\)
  • 幂等矩阵:\(A^2=A\)
  • 对合矩阵:\(A^2=E\)
  • 对称矩阵:\(A^T=A\)
  • 反对称矩阵:\(A+A^T=diag\)
  • 正交矩阵:\(A^T=A^{-1}\)
  • 正定矩阵:\(X^TAX>0\)
  • 稀疏矩阵:含有大量零元素的矩阵
  • 严格对角占有阵:对角线上的元素比这一行或一列元素的和还大

一些常用的公式

  • \(|kA|=k^n|A|\)
  • \((AB)^T=B^TA^T\)
  • \(A^*A=|A|E\)
  • \((AB)^*=B^*A^*\)
  • \((kA^*)=k^{n-1}A^*\)
  • \((A^*)^*=|A|^{n-2}A\)
  • \((AB)^{-1}=B^{-1}A^{-1}\)
  • \((kA)^{-1}=\frac{1}{k}A^{-1}\)
  • \(|A^{-1}|=|A|^{-1}\)
  • \(|AB|=|A||B|\)
  • 转置和求逆可以换顺序,伴随和求逆也可以换顺序

可逆判定及求解

  1. \(AB=E\)说明\(A\)\(B\)都可逆,且互为逆矩阵
  2. \(\Leftrightarrow |A|\neq 0\qquad A^{-1}=\frac{1}{|A|}A^*\)
  3. 通过与单位矩阵写到一起初等变换求逆

矩阵相抵(等价)

定义

\(A,B\in P^{m\times n}\),则\(A\)\(B\)相抵\(\Leftrightarrow\)存在可逆矩阵\(P,Q\),有\(PAQ=B\Leftrightarrow r(A)=r(B)\)

等价标准型

\(A\in P^{m\times n},r(A)=r\),则存在可逆矩阵\(P\in P^{m\times m},Q\in P^{n\times n}\),使得\(PAQ=\begin{bmatrix} Er&\\&O \end{bmatrix}\)

矩阵的秩

  • \(r(A_{m\times n})\leq min(m,n)\)
  • \(r(AB)\leq min(r(A),r(B))\)
  • 乘可逆矩阵不改变秩
  • \(r(\begin{bmatrix} A&\\&B \end{bmatrix})=r(A)+r(B)\)
  • \(r(\begin{bmatrix} A&C\\&B \end{bmatrix})\geq r(A)+r(B)\)
  • \(r(A+B)\leq r(A)+r(B)\)
  • \(r(AB)\geq r(A)+r(B)-n\)
  • \(r(ABC)\geq r(AB)+r(BC)-r(B)\)
  • \(r([A B])\leq r(A)+r(B)\)

线性空间

定义

满足: 1. 一个非空集合 2. 两个封闭的运算 3. 八条运算规律

常见的线性空间

  1. \(P^n,R^n\)
  2. \(P^{m\times n}\)
  3. \(P[x]_n\)
  4. 对称区间上的定积分

线性表示

判断\(\beta\)是否可以用向量组\(\alpha_1,\alpha_2,...,\alpha_n\)线性表示,即判断方程组\(AX=\beta\)是否有解,可以等价替换为某个基下的坐标表示

线性相(无)关

判断向量组\(\alpha_1,\alpha_2,...,\alpha_n\)是否线性相关,即判断程组\(AX=O\)是否有非零解,同样可以等价替换为某个基下的坐标表示

极大线性无关组

是指在一个向量组中,具有线性无关性质的最大子集。组内的所有向量都是线性无关的,即没有任何一个向量可以表示为其他向量的线性组合。一旦加入新的向量,这个组就会失去线性无关性。

基与维数

在向量空间中, 是一组向量,这组向量具有以下两个性质: 1. 线性无关性:基中的任何一个向量都不能由其他向量的线性组合表示。 2. 张成性:基中的向量可以通过线性组合生成整个向量空间中的任意一个向量。

简单来说,基是生成整个向量空间的最小向量集。基的选择并不唯一,不同的基可以生成同一个向量空间。

维数

维数 是描述向量空间大小的一个重要量。具体来说,维数是一个向量空间中任意一组基的向量个数。由于向量空间的基具有线性无关性和张成性,因此所有基的向量个数是相同的,进而维数是向量空间的一个不变性质。

坐标

\(\alpha=[\epsilon_1,\epsilon_2,...,\epsilon_n][x_1,\dots,x_n]^T\)

基Ⅰ\(\epsilon_1,\epsilon_2,...,\epsilon_n\)到基Ⅱ\(\eta_1,\eta_2,...,\eta_n\)的过渡矩阵为M: * 基变换公式:\([\epsilon_1,\epsilon_2,...,\epsilon_n]=[\eta_1,\eta_2,...,\eta_n]M\) * 坐标变换公式:\(X=MY,Y=M^{-1}X\)

这些概念在多项式空间、函数空间、矩阵空间等更抽象的向量空间中也有广泛应用。

欧式空间

定义

n维欧式空间是定义了内积的线性空间,可以表示为\(\mathbb{R}^n\),其中n是正整数。\(\mathbb{R}^n\)表示所有n元有序实数数组(即向量)的集合。

在欧式空间中,有几个关键的性质: 1. 内积:欧式空间中的向量之间可以定义内积(也叫点积),例如在二维或三维空间中,向量\(\mathbf{u}\)\(\mathbf{v}\)的内积定义为\(\mathbf{u} \cdot \mathbf{v} = u_1v_1 + u_2v_2 + \dots + u_nv_n\)

  1. 距离:任意两个点之间的距离可以用内积定义。例如,欧式距离\(d(\mathbf{u}, \mathbf{v})\)可以表示为\(d(\mathbf{u}, \mathbf{v}) = \sqrt{(\mathbf{u} - \mathbf{v}) \cdot (\mathbf{u} - \mathbf{v})}\)

  2. 正交性:当两个向量的内积为零时,这两个向量被称为正交的。在二维和三维空间中,正交向量对应于互相垂直的向量。

施密特正交化

标准正交基指的是在向量空间中,所有向量都相互正交(即两两垂直),且每个向量的长度为1的基底集合。

施密特正交化(Gram-Schmidt 正交化)是一种将一组线性无关的向量转换为一组标准正交基的方法。这个过程通过逐步正交化和标准化来构造一组新的向量,使得它们相互正交且每个向量的长度为1。

假设我们有一组线性无关的向量 \(\{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n\}\),施密特正交化的步骤如下:

  1. 初始化:令第一个标准正交基向量 \(\mathbf{u}_1\) 等于原向量 \(\mathbf{v}_1\)\(\mathbf{u}_1 = \mathbf{v}_1\) 然后将其标准化得到第一个正交基向量 \(\mathbf{e}_1\)\(\mathbf{e}_1 = \frac{\mathbf{u}_1}{\|\mathbf{u}_1\|}\)

  2. 迭代正交化:对每个后续的向量 \(\mathbf{v}_k\)\(k = 2, 3, \dots, n\)),首先从原向量中减去其在先前所有已构造的正交基向量上的投影: \(\mathbf{u}_k = \mathbf{v}_k - \sum_{i=1}^{k-1} \text{proj}_{\mathbf{e}_i}(\mathbf{v}_k)\) 其中,投影的计算公式为: \(\text{proj}_{\mathbf{e}_i}(\mathbf{v}_k) = \frac{\mathbf{v}_k \cdot \mathbf{e}_i}{\mathbf{e}_i \cdot \mathbf{e}_i} \mathbf{e}_i = (\mathbf{v}_k \cdot \mathbf{e}_i)\mathbf{e}_i\) 然后,将正交化后的向量标准化得到新的正交基向量: \(\mathbf{e}_k = \frac{\mathbf{u}_k}{\|\mathbf{u}_k\|}\)

  3. 结果:经过上述步骤,最终得到的向量组 \(\{\mathbf{e}_1, \mathbf{e}_2, \dots, \mathbf{e}_n\}\) 是原向量组的标准正交基。

正交矩阵

正交矩阵是指行向量或列向量互相正交且均为单位向量的方阵。对于一个n阶正交矩阵\(Q\),它满足以下条件:

  1. 矩阵乘积性质\(Q^T Q = Q Q^T = E\) 其中\(Q^T\)是矩阵\(Q\)的转置,\(E\)是n阶单位矩阵。这意味着正交矩阵的逆矩阵等于它的转置,即: \(Q^{-1} = Q^T\)

  2. 保持向量的长度:对于任何向量\(x\),正交矩阵\(Q\)都保持\(x\)的欧几里得长度,即: \(\| Qx \| = \| x \|\) 这说明正交矩阵对应的线性变换是一个等距变换(例如旋转或反射)。

  3. 列向量和行向量的正交性

  4. 矩阵\(Q\)的任意两列向量(或行向量)都是互相正交的,即它们的点积为零。
  5. 每个列向量(或行向量)的长度为1。

相似对角化

特征值和特征向量

矩阵的特征值\(\lambda\)满足\(A\xi=\lambda\xi(\xi\neq 0)\),特征值是特征方程\(f(\lambda)=|\lambda E-A|=0\)的根,求特征向量只需要求\((\lambda E-A)X=O\)不为零的通解。

特征向量满足以下性质: * \(\lambda_1+\dots+\lambda_n=tr(A)\) * \(\lambda_1\dots\lambda_n=|A|\) * \(\lambda^k\)\(A^k\)的特征值,\(k=-1,0,1\dots\) * A的特征值(含重数)和特征向量也一定g(A)的特征值(含重数)的特征值和特征向量,但反过来就不一定了

矩阵的相似

  1. 定义:\(P^{-1}AP=B\)
  2. 性质:A与B相似\(\Rightarrow\quad r(A)=r(B),|A|=|B|,tr(A)=tr(B)\),\(A^k\)\(B^k\)相似,g(A)与g(B)相似
  3. 判断方法:若A,B均能对角化,则:A与B相似\(\Leftrightarrow |\lambda E-A|=|\lambda E-B|\)

矩阵的对角化

  1. 判断方法:
  2. 充要条件为n个线性无关的特征向量
  3. 若有n个不同的特征值,则可对角化
  4. 特征值重数与属于该特征值的特征向量个数相等
  5. 对角化方法:求特征值和特征向量\(P^{-1}AP=\Lambda\)
  6. 作用:\(A^k=P\Lambda^k P^{-1},f(A)=Pf(\Lambda)P^{-1}\)
  7. 是对称矩阵一定可以相似对角化\(U^{-1}AU=\Lambda\quad(U^{-1})=U^T\)

二次型

配方法

用配方法化二次型为标准型,可能涉及到换元

正交线性替换

定义

假设我们有一个 \(n\) 维向量 \(\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}\),如果存在一个 \(n \times n\) 的正交矩阵 \(P\),使得新的变量 \(\mathbf{y} = \begin{bmatrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{bmatrix}\) 可以表示为:

\(\mathbf{y} = P^T \mathbf{x}\)

那么这个变换就被称为正交线性替换。因为 \(P\) 是正交矩阵,所以它满足 \(P^T P = I\),即它的转置矩阵等于其逆矩阵。

在二次型中的应用

在二次型 \(Q(\mathbf{x}) = \mathbf{x}^T A \mathbf{x}\) 中,使用正交线性替换可以将二次型化为对角形式。这意味着通过适当的正交线性替换,可以将原来的二次型化简为一组不相关的新变量之和:

\(Q(\mathbf{x}) = \mathbf{y}^T D \mathbf{y}\)

其中 \(D\) 是一个对角矩阵,矩阵 \(D\) 的对角元素即为原来矩阵 \(A\) 的特征值。这个过程在二次型的标准化、研究二次型的正定性或半正定性,以及计算二次型的值等方面非常有用。

二次型的规范型

实数域上二次型的规范型为:\(z_1^2+z_2^2+\dots+z_p^2-z_{p+1}^2-\dots-z_r^2\)

相关量的定义如下: * 正惯性指数:p * 负惯性指数:r-p * 符号差:2p-r

矩阵的合同

  1. 定义:\(C^TAC=B,|C|\neq 0\)
  2. 性质:\(r(A)=r(B)\)
  3. 判断:
  4. 实对称矩阵A和B合同\(\Leftrightarrow\)r(A)=r(B)且正惯性指数相同
  5. 若A是正定矩阵且B是与A阶数相同的对称矩阵,则A与B合同\(\Leftrightarrow\)B是正定矩阵
  6. 若A与B是相似的是对称矩阵,则A与B在实数域上合同
  7. 标准型:\(C^TAC=\begin{bmatrix} E_p&O&O\\O&-E_{r-p}&O\\O&O&O \end{bmatrix}\)

矩阵的正定

定义

  1. 对称性:矩阵 \(A\) 必须是对称矩阵,即 \(A = A^T\)

  2. 正定性:对于任何非零向量 \(x\),都有 \(x^T A x > 0\)

判别

  • 矩阵的特征值全部为正。
  • 矩阵的顺序主子式全部大于0
  • 正惯性指数=n
  • 存在n阶实可逆矩阵B,使\(A=B^TB\)
  • 与n阶单位矩阵合同

性质

  • \(A\) 是正定矩阵,则 \(A\) 是可逆的,且 \(A^{-1}\) 也是正定矩阵。
  • \(A^k\)正定,k为任意正整数