高等代数九线性空间

發表於 2022-08-19 更新於 2025-12-31 分類於高等代数文章字數： 14k 所需閱讀時間 ≈ 49 分鐘

视频 86-120

线性映射

研究线性映射的运算：线性映射作为映射，可以做乘法运算，乘积仍是线性映射，还可以定义线性映射的加法和纯法
研究线线性映射的整体结构：线性映射的运算，域F上 V到V’的所有线性映射组成的集合，记作Hom(V,V’), 对于线性映射的加法和纯量乘法，成为域F上的一个线性空间，V上所有线性变换组成的集合Hom(V,V) （自身到自身）即是域F上的线性空间，又是一个有单位元的环
研究线性映射的核与象， V到V’的线性映射A的核 Ker A是一V的一个子空间，A的象Im A是V’的一个子空间. 线性映射A的核Ker A可以用来研究线性空间V的结构
研究线性映射和线性变换的矩阵表示。
V上的线性函数以及V的对偶空间V’ (他是V上所有线性函数组成的线性空间)

9.1 线性映射及其运算

两个线性空间。元素映射，加法映射（保持加法），乘法映射（保持乘法）。则是线性映射

V到自身的线性映射。通常称为V上的线性变换。

线性空间V->域F, 称为V上的线性函数

例如

区间(a,b)上，所有一次可微函数集合，构成线性空间，其求导过程是一个线性空间，其导函数集合也是一个线性空间（这里的映射是双射）
区间[a,b]上所有连续函数组成集合，构成线性空间，做定积分是一个到R的映射，也是线性映射，（这里可能不同函数的定积分值相同，不是单射，但也是线性映射，这里展示列一种降维的例子）
过原点的3维向量集合到一个过原点给定平面的投影向量，同样是一个带有降维的线性映射
矩阵 $A_{s\times n}$, A: $F^n\to F^s, a \to Aa$ 线性代数里常见的矩阵乘法，这个例子中如果s > n, 将不是满射，
零映射，把V中任意向量都映射到 V’中零向量
恒等变化 V 所有向量映射到自身，记作$I$
标准映射 V -> V/W，是一个线性映射
线性空间之间的一个同构映射

线性映射的存在性，投影

定理1. V和V’ 都是域F上的线性空间，V有限维度，V中取基S,V’任意n个向量$t_i$, 下面映射是一个线性映射

A: V-> V’
a 的按S表出的 $\sum {k_i}s_i \to \sum k_it_i$
这个其实就是说V中的按S的坐标，在V’中按照t_i的坐标，首先这始终是线性映射，置于映射结果就看t_i的线性有关性了

定理2. V是域F上的一个线性空间，U和W是V的两个子空间，且U和W关于V互补

任取 V中向量a,唯一表示成两个子空间向量和, a=a_1+a_2,那么a_1,a_2分别称作在子空间中的投影
投影是幂等变换

定义2：如果线性变化A 满足$A^2 = A$那么称作幂等变换

定义3：两个线性变换 A,B 如果 AB=BA=0 那么成A,B是正交的

(上面 V到W的投影$P_W$)和(V到U的投影$P_V$)是正交的
- 也就是投影到W 再投影到U 一定投影到零

三，线性映射的运算和线性映射的整体结构

V和V’都是域F上的线性空间，

所有线性映射组成的集合记作$Hom(V,V’)$
所以线性变换组成的集合记作Hom(V,V)

$A\in Hom(V,U)， B\in Hom(U,W)$ 那么 $BA\in Hom(V,W)$ 非常显然不满足交换律

若 $A\in Hom(V,V’)$ 且可逆，那么是一个同构映射， $A^{-1} \in Hom(V’,V)$

定义，线性映射之家你的加法和乘法:

$A,B\in Hom(V,V’)$

$(A+{定义}B)a=Aa+{V’}Ba$

$(k\cdot_{定义}A)a=k\cdot_{V’}(Aa)$

能够验证线性映射满足线性空间8条法则，因此$Hom$是性空间。这里我们得到一种映射的集合是线性空间

线性映射的乘法有左右分配率，但是没有交换律

特别的 $Hom(V,V)$ 对于加法和乘法构成一个有单位元的环

定义4. 一个非空集合A，如果有加法、乘法运算，以及域F与A的纯量乘法运算，并且A对于加法和纯量乘法成为域F上的一个线性空间，A对于加法和乘法成为一个有单位元的环，A的乘法与纯量乘法满足 $k(ab)=(ka)b=a(k)b, k\in F,ab\in A$

那么称A是域F上的一个代数，线性空间维数A 称作代数A的维数
简短说:
- A自身环
- [F,A] 构成线性空间
- $k(ab)=(ka)b=a(k)b, k\in F,ab\in A$
- 其实这里 A自身环和 <F,A> 的线性空间两个中的加法是同样的

$Hom(V,V)$ 是域F上的一个代数

矩阵 $M_n(F)$ 对于矩阵的加法、乘法与纯量乘法，成为域F上的一个代数

Hom(V,V’) 中定义减法 $A-B = A+(-B)$

Hom(V,V)中定义 正整数 指数幂: $A^n=$ n个A做乘法

这里定义的幂次全是整数

可逆时 $A^{-m}\to (A^{-1})^m$

$A^m\cdot A^n = A^{m+n}$

$(A^m)^n = A^{mn}$

$f(x)\in F[x]$ 多项式，带入$A$, 显然$f(A)\in Hom(V,V)$, 称作f(A)的一个多项式，

$f(A)g(A)=g(A)f(A)$, 注意这里要两边一样

所以多项式组成集合记作$F[A]$, $F[A]$对于减法乘法都封闭，所以是一个环,

$F[A]$ 是 Hom(V,V)的子环
$F[A]$是交换环
$I\in F[A]$
$F[A]$中所有数乘变换组成的集合是 $F[A]$的一个子环，且域F与这个子环之间有一个双射，且保持加法乘法运算, 因此$F[A]$可以看成$F$的一个扩环
f(x)中可以用$F[A]$中元素带入

例如线性空间V的两个互补子空间U,W的投影 $P_U,P_W$

自身幂等
$P_{U},P_{W}$正交
$(P_{U}+P_{W})a = a$ 所以$P_{U}+P_{W}=I$

那么逆命题呢?

在线性空间V上 $A+B=I, AB=0,A^2=A,B^2=B$ 那么A,B能否看作两个子空间的投影呢
直接反过来，U=Im A, V= Im B
- 加，纯量乘封闭 U,V 都是子空间
- 任意 V中可表示两个的和，所以 U+V (子空间的和运算) =V，接下来只需要证明交只有零向量
- 任意属于交的 a=Ax=By 两种表示法
  - a=Ax=AAx=Aa=A(By)=(AB)y=0
- 至此 U,V是两个互补线性子空间
- 还需要证明 A,B就分别是他们的投影即$P_U = A$
  - 那么根据定理2(互补，表示成子空间向量和，分量的映射，那么就是投影)

命题2.

A,B 是V上正交幂等变换, A+B=I. 则$V=Im A \oplus Im B$ 这里是直和

9.2 线性映射的核与象

定义1. 核 A:V->V’ ，那么ker A = V中映射到V’的零向量的所有向量

ker A = { $a\in V | Aa=0$ }

$Im A = AV$

命题1. ker A是V的一个子空间, Im A是 V’的一个子空间

因为加法乘法不变，所以只需要证明封闭性即可
同样 A是线性映射，保证了 Im A的加法乘法的运算性质，只需要证明封闭

命题2 A是V-> V’,

是单射当且仅当 Ker A = 0,
1. => 因为0始终属于Ker A
2. <= 任意两个Aa=Ab相等那么差A(a-b)=0反过来在a-b \in ker 0中，而ker 0只有0,所以 a=b
满射当且仅当 Im A = V’，就是定义

定理1， A:V->V’, 那么 V/Ker A 和 Im A同构

$\sigma: a+Ker A \to Aa$
- 是映射(同样输入唯一输出) a+kerA=b+kerA <=> a-b \in ker A ,=> A(a-b)=0 <=> Aa=Ab 且是单射，满射，双射（单射双射线性映射不要求，但是同构要求）
- 再容易证明保持加法和乘法，所以同构映射

定理2. 设V和V’都是F上的线性空间,V是有限维，摄A是一个线性映射，Ker A和Im A都是有限维度且 dim Ker A + dim Im A = dim V

由上 dim(Im A) = dim(V/Ker A) = dim(V) - dim(Ker A)

定理3. 有限维线性空间,A:V->V’ 线性映射

A是单射
<=> Ker A = 0
<=> dim(Im A)=dim (V) = dim(V’)
<=> ImA=V’
<=>A是满射

推论1. A: V->V 线性变换：单射<=> 满射

根据这个，可以有矩阵乘法维数的一种证明

$A_{s\times n}:F^n\to F^s$

Ker A 等于 AX=0 的解空间

ImA 等于A的列空间

$dim Ker A + dim Im A = dim F^n$ 这在MIT 课用矩阵解和图画展示了

dim (null space) + rank A = n(列数)

注意！对于线性变化，虽然维数和等于 dim(kerA)+dim(ImA)=dim V, 但是两个空间的和并不一定等于，其实显然，本来ker A是V中的，但是Im V是转换过的, 这两个没啥关系，相当于按照 ker A的规则压缩，压缩后的和之前的就不相关的感觉更自然

比如 $K[x]n$ 求导D, $Im D = K[x]{n-1}, Ker D = K$ 显然 $K[x]_{n-1}+K\neq K[x]_n$

命题3. A是线性空间V上的线性变换，如果是V上的幂等变换$A^2=A$，那么 $V=Im A \oplus Ker A$

比上面多一个幂等
上面已经证明了维数 ImA 和KerA的和是V,那么只需要证明它们是互补（任何V中可表示，之间交为0）

推论2, V中互补的U,W. $U= Im P_U, W=Ker P_U$,

前半之前证明过了，后半根据命题3

定义. A:V->V’ 余核 Coker A = V’/Im A

命题4. A:V->V’ （线性空间之间的线性映射), 那么满射 <=> Coker A = 0

满射
<=> ImA=V’
<=> V’/Im A=0

9.3 线性映射和线性变换的矩阵表示

A:V->V’, $F^n\to F^s$

在V中任意x=$\sum k_ia_i$ 用V的基a唯一表示

而对于V中的基的每个向量，经过变化$Aa_i = \sum l_{ij} a’_j$ 在V’中，被V’的的基a’ 唯一表示

直接关注基的变换 $(Aa_1,\cdots,Aa_n) = (a’_1,\cdots,a’_s) (l 矩阵)$

那么要表示x,就是两边同时右乘上 k的列向量 A x = (A V基) * k列 = V’基 * l及转换矩阵 * k列

对于线性变换(V->V):

(A V基) = V基(两边选择一样的基) * l及转换矩阵
所以把线性变换对应一个右乘$L_A$矩阵
变换A V基 = V基 * 矩阵A

若 A 是幂等变换，根据命题3, $V=Im A \oplus Ker A$

基a(Im A)+基b(Ker A) 是V的一个基
Aa=a
Ab=0
所以如果选择基 = [...基a,...基b]
那么矩阵A = 对角矩阵[I_rank(a),...0]

命题1. rank(变换A) = rank(V中选择基的一个矩阵A)

rank(变换A) = dim(Im A) = rank(A)

Hom(V,V’) 与$M_{s\times n}(F)$的关系, Hom(V,V) 与$M_{n}(F)$的关系

定理1. (选V基)->(选V’基): 线性映射A 与对应的变换矩阵A 是同构的

Hom(V,V’) 同构于 $M_{s\times b}(F)$, 注意的是这里两边基先选定，而基的选定并不要求标准，就已经有了同构
dim (Hom(V,V’)) = sn = (dim V)(dim V’)

特殊的V’ 取V

变换: (变换A变换B)a=变换A(变换B a)=变换A (a 矩阵B)=(变换A a) 矩阵B = a 变换A 矩阵B

定义1. M,M’都是域F上的代数，双射$\sigma$ 是线性空间的同构映射，又是环的同构映射，那么称作代数的同构映射

这里其实再次强调了，同构不只是元素的映射还有运算的保持

定理2. $线性变换A\to 矩阵A$ 是 Hom(V,V) 到 M_n(F)的一个同构映射

变换可逆

<=> 存在变换B, 变换A变换B=变换B变换A=变换I
<=> 存在矩阵B, 矩阵A矩阵B=矩阵B矩阵A=矩阵I
<=> 矩阵可逆

类似的变换的幂等与矩阵的幂等也是冲要的

向量在线性映射下象的坐标

(变换A)a=变换A((基)X)=(变换A 基)X=基(矩阵A)X
所以对于同样的基的选择，(A_基)X是新的坐标,….. 这里矩阵A是与基的选择是有关的！！！！，所以在书写上应该把选定基作为一个很前置的很固定的条件

对于线性映射 A:V->V’ 来说，a的新坐标 $= 矩阵A_{基V\to 基V’}X$

不同基下矩阵之间的关系

基1 变换A_1, 基2 变换A_2

$A_2=S^{-1}A_1S$

已知

变换A 基1 = 基1 * 矩阵A_1

变换A 基2 = 基2 * 矩阵A_2

基2 = 基1 * 矩阵S

那么有

$变换A 基2 = 变换A (基1 * 矩阵S) = (变换A 基1) * 矩阵S = (基1 矩阵A) * 矩阵S = ((基2 * S^{-1})A)S = 基2 (S^{-1}AS)$

表明同一个线性变换，不同的基下的矩阵之间的相似的！！！！！

相似的矩阵的 det,rank,trace迹是相等，叫做线性变换的 det,rank,trace

5章证明过利用 trace(AB)=trace(BA) 核心结论
这是一个找相似矩阵的最简单形式的好理由

9.4 线性变换的特征值，特征向量，线性变换和对角化的条件

希望找到对角矩阵D

变换A 基 = 基 * 对角矩阵

一、线性变换的特征值和特征向量

$(变换A) 非零向量a = \lambda a, \lambda\in F$

特征值$\lambda$和对应特征向量$a$

作用就是把这个特征向量压缩/拉伸倍数

变换A的特征值 <=> 矩阵A的特征值

特征向量是属于特征值的一个特征向量：变换A <=> 矩阵A

二、线性变换可对角化的充要条件

如果V中存在一个基，使得线性变换A在这个基下的矩阵是对角矩阵，那么称A可对角化

定理1. 域F上n维线性空间V上的线性变换A可对角化，当且仅当A有n个线性无关的特征向量，此时在基下的矩阵为特征值的对应位置的对角矩阵，称作A的标准形

推论1. V上的线性变化A可对角化，当且仅当V中存在由A的特征向量组成的一个基

特征子空间：对于特征值$\lambda_0$, 所有该特征值对应的特征向量构成的空间, 记作$V_{\lambda_0}$

$a\in V_{\lambda_0}$<=> 变换$Aa=\lambda_0a$ <=> $(\lambda_0I-变换A)a=0$ <=> $a\in Ker(\lambda_0I-变换A)$

也就是特征值的特征子空间是线性变换$\lambda_0I-A$的核, 所以度 = n-解空间

所以 $dim(V_{\lambda_0})=n-rank(\lambda_0I-A)$

推论2, 可对角化当且仅当属于不同特征值的特征子空间的维数直和等于n

推论3. 可对角化，当且仅当 V=特征子空间的直和

9.5 线性变换的不变子空间, Hamilton-Cayley 定理

定义1. 设V是域F上的线性空间, A是V上的一个线性变换，V的子空间W如果具有下述性质：“对于任意 $a\in W$ 都有$变换A a\in W$，那么称W是A的不变子空间, A-子空间

零子空间0 是平凡的不变子空间

命题1. 变换A的核与象，变换A的特征子空间都是 A-子空间

核：因为这个空间里所有的运算结果都是0向量，而零向量的确属于核
象：因为 $F^n$中任意向量经过变换都得到象，而象是$F^n$的子空间，变换后依然是象
特征子空间: 对于一个给定的特征子空间，根据定义，每个向量在这个空间中都是 $\lambda$ 倍的长度变换，

命题2. A,B都是V上的线性变换，如果A,B可交换，那么Ker B,Im B, B的特征子空间都是A-子空间

这里只是充分: 可交换 => Ker B, Im B, B特征子空间，是 A-子空间
$a\in ker B \to Aa\in ker B$: 变换B(变换A a) = 变换A (变换B a) = 变换A 0 = 0
$a\in Im B\to Aa\in Im B$: 存在b,使得a=Bb, Aa=ABb=BAb
$a\in V_{\lambda}\to Aa\in V_{\lambda}$ : $Ba=\lambda a$, $BAa=ABa=A\lambda a=\lambda Aa$

推论1, $f(x) \in F[x]$ 则 $Ker f(A),Im f(A),f(A)$的特征子空间都是 A-子空间，因为$f(A)$和A可交换

命题3. 不变子空间的和与交仍是 A的不变子空间

命题4. 单个非零向量的生成空间是A-子空间，当且仅当是A的一个特征向量

特征向量 => 显然能构成
如果能构成 => 满足特征向量定义

命题5. 由向量组 a1,a2… 生成空间W是A-子空间，当且仅当$Aa_i \in W$

是A-子空间 => 定义需要属于
如果全部属于 => 任何一个空间中向量可被aI线性表示，也就拆分表示再合并，可以被 Aai线性表示

总而言之，如果W是V上线性变换A的不变子空间

那么可以诱导出子空间W上的线性变换 A|W
- 定义 $a\in W, (A|W)a=Aa$
又可以诱导出商空间 V/W上的线性变换
- 定义 $V/W\to V/W$
  - $a+W\to Aa+W$

二、不变子空间研究线性变换的矩阵表示

A是线性变换且 A不可对角化，寻求A的最简形式

定理1. A是域F上n维线性空间V上的一个线性变换，A在V的一个基下的矩阵为分块对角矩阵当且仅当V能分解成A的非平凡不变子空间的直和

定理2. 设V是域F上的线性空间，A是线性变换, $K[x]$中 f(x)=f1(x)f2(x),且(f1(x),f2(x))=1 则

Ker f(A)=ker f1(A) 直和 Ker f2(A)
显然带入变换A, Ker fi(A) 是 Ker f(A)的子集，因为 f(A)a=任意 * fi(A) a=任意 * 0 = 0
又多项式无公因式 u(x)f1(x)+v(x)f2(x)=1
- u1(A)f1(A)+u2(A)f2(A)=I
- 取 a \in ker f(A)
- a=Ia=u1(A)f1(A)a+u2(A)f2(A)a
  - 前面这个左乘f2(A)有 f2(A) u1(A)f1(A)a = u1(A) f(A)a=u1(A) 0 = 0, 说明属于ker f2(A)
  - 后面同理属于 ker f1(A)
- 这里说明了kerf(A)中的任意 a 可以表示成 ker f1(A)和ker f2(A)中的两个向量之和，这里证明了 “和”
- 那么还需要证明唯一表示或者交只有0向量
- 取 a \in ker f1(A)交 ker f2(A)
- a=Ia=u1(A)f1(A)a+u2(A)f2(A)a=0, 说明只有0向量

定理3. 把定理2推广到更多子空间的直和，f(x)=\prod fi(x), 且 (fi(x),fj(x))=1,i \neq j两两互素

那么 ker f(A)= 直和 ker fi(A)
证明: 归纳法

三、线性变换和矩阵的零化多项式，Hamilton-Cayley定理

定义2, F上的一元多项式使得 f(A)=0, 那么称 f(x)是A的一个零化多项式， A是线性变换

令 n = dim V, 则$dim(Hom(V,V))=n^2$ 从而

$I,A,A^2,\cdots,A^{n^2}$ 一定线性相关
- 不妨令 $A^0=I$
- 存在不全为零的$k_i$使得 $\sum_{i=0}^{n^2} {k_i} A^i=0$
- 令 $f(x)=\sum_{i=0}^{n^2} k_ix^i$ ，则$f(A)=0$是一个非零多项式的零化多项式

定义3. F[x]中的多项式使得 f(A)=0, 那么称 f(x)是A的一个零化多项式，A是矩阵

和定义2不同的是这里是矩阵
矩阵总是能找到一个线性变换和线性变换选的基
- 线性变换表达式 <=> 矩阵表达式构成映射

伴随矩阵 $A^A=AA^=|A|I$

[2x^3+x^2+1,x^2-3;
x^3-1,2x+5] 按幂次拆分

= x^3[2,0;1,0]+x^2[1,1;0,0]+x[0,0;0,2]+[1,-3;-1,5]

Hamilton-Cayley定理： A是域F上的n级矩阵，A的特征多项式是A的零化多项式

特征多项式的来源是特征值定义+行列式
零化多项式是指把A带入多项式结果会是零矩阵

证明:

设$B(\lambda)$ 是 $\lambda I-A$ 的伴随矩阵
$B(\lambda)(\lambda I -A) = |\lambda I-A|I=f(\lambda)I$
- 因为$B(\lambda)$ 是$\lambda I-A$ 的代数余子式，所以$B(\lambda)$最高次不超过$\lambda^{n-1}$
- $=(\sum_{i=0}^{n-1} \lambda^i B_i)(\lambda I-A)$
- $=\lambda^n B_{n-1}-B_0A + \sum_{i=1}^{n-1}(\lambda^i (B_{i-1}-B_iA))$
右侧$f(\lambda)I=(\sum_{i=0}^n a_i\lambda^i)I$
系数对应相等
- 得到很多 $B_{i-1}-B_iA=a_{i-1}I$
- 配幂次得到 $B_{i-1}A^{i-1}-B_iA^n=a_{i-1}A^{i-1}$
- 全部相加左侧=$0$, 右侧=$f(A)$ 也就是把$A$带入$f(\lambda)$

所以 $f(\lambda)=\prod f_i(\lambda)^{r_i}$, 其中$f_i$是两两不等首一不可约多项式

则 $V = Ker f(A) =\oplus_i Ker(f_i(A)^{r_i})$ 所有的变换的核的直和
更特别的如果$f(\lambda)=\prod (\lambda-\lambda_i)^r_i$
- 则 $V=\oplus_i Ker((A-\lambda_i I)^{r_i})$
  - 其中每一核称为A的根子空间

9.6 线性变换和矩阵的最小多项式

V是域F上的n维线性空间

A是V上的一个线性变换，找一个合适的基使得A在此基下的矩阵具有最简单的形式

第一步9.5 找A的一个非零的零化多项式

f(\lambda) 分解成两两不等不可约多项式方幂的乘积，
- 则V能分解成A的不变子空间的直和
- 每个不变子空间取一个基，合起来成为V的一个基
- A在这个基下的矩阵是分块对角矩阵

第二步，每个不变子空间中取依托各合适的基，使得A在这个不变子空间上的限制在此基下的矩阵具有最简单形式

一、最小多项式的定义和性质

定义1. 线性变换A, A的所有非零的零化多项式中，次数最低的首相系数为1的多项式成为A的最小多项式

命题1. 唯一的

证明首先如果两个都是最小多项式那么如果次数不同，那么次数大的肯定不是
那么如果有两个次数相同的但是不等的最小多项式，那么它们的差一定是更小次数的零化多项式

命题2. 任意零化多项式是最小多项式的倍数

多项式带余除法，如果有余那么这个余多项式是幂次更小的零化多项式

命题3. 最小多项式和特征多项式的根的集合相同（根的重数幂次不一定相同）

显然最小多项式 | 特征多项式，所以最小多项式的根是特征多项式的根
反之若存在特征值不是最小多项式根，选一个对应特征向量a,那么有 0=(零化多项式)=m(A)a=(特征值替换)=m(lambda) a, 因此是一个根

命题4. A是域F上的n级矩阵，域E包含F,则A的最小多项式m(lambda),与A的特征多项式 f(lambda)在E中有相同的根

取一对特征向量a和特征值lambda: 0=m(A)a=(展开)a=m(lambda)a, 所以m(lambda)=0

命题5. 域F上最小多项式为 m(lambda), 域E包含F,那么仍然为m(lambda)

首先 m(lambda)一定是 E上的零化多项式，那么最小多项式只可能是它的因式，而这个因式在F上会同样为零化多项式

二、几类特殊线性变换或矩阵的最小多项式

A是幂零指数为l的幂零变换 <=> $\lambda^l$是A的一个零化多项式，而当$r < l$时，$\lambda^r$不是零化多项式<=> A的最小多项式是 $\lambda^l$

A幂等变换 <=> $\lambda^2-\lambda$ 是一个零化多项式，最小多项式为$\lambda,\lambda^2-\lambda,\lambda -1$中的一个

A是对合变换 <=> $\lambda^2-1$是一个零化多项式，最小多项式同理

A是周期为m的周期变换, <=> $\lambda^m-1$是零化多项式，$\lambda^{<m}-1$不是零化多项式, <=> 同理是前面的因式，不是后面的因式

定义2:

Jordan块，对角是a,对角右移1位全是1,
例如 [a,1,0;0,a,1;0,0,a]

命题6：主对角元为a的r级Jordan块，最小多项式等于它的特征多项式 $f(\lambda)=(\lambda-a)^r$

$J_r(a)-aI=J_r(0)$有$J_r(0)^r=0,J_r(0)^{<r}\neq 0$

定理1. V是线性变换，如果V能分解成A的一些非平凡不变子空间直和 $V=W_1\oplus W_2\oplus \cdots\oplus W_s$

$m(\lambda)=$ 每个子空间最小多项式的最小公倍式
推论4,如果A能写成对角分块矩阵，那么每个对角的块的最小多项式就可以作为m_i用到上面去

三、用最小多项式研究线性变换的矩阵表示

定理2：线性变换可对角化 <=> 当且仅当 A的最小多项式m(lambda)在F[\lambda] 能分解成“不同”一次因式的成绩

9.4推论3 V能表示成不同特征子空间的直和
- $V_{\lambda_i}=Ker(A-\lambda_i I)$
- 因为 $V_{\lambda_i}$ 是A的不变子空间（其中任何向量经过变换后还属于它）
- 那么根据上面 (A|V)a=Aa, 其中A|V表示在子空间的同样/诱导出的变换A
- 任意$a\in V_{\lambda_i}$（诱导A-$\lambda_i$ 诱导I ）a=(A-$\lambda_i$I)a=0,从而 $\lambda-\lambda_i$ 是诱导变换A的零化多项式，，所以得到m
- 充分性，不同特征子空间的lambda不相同，所以多项式互素

推论5 n级矩阵A可对角化，当且仅当A的最小多项式，在F[lambda]中能分解成不同的一次因式的成绩

命题7

幂等变化A一定可对角化
- 最小是 $\lambda^2-\lambda$ 的因式，一定可以
幂零指数l > 1的幂零变换一定不可对角化
- 最小是$\lambda^l$ 一定不可以
特征不等于2时，对合变换A一定可对角化。特征等于2时，不等于I的对合变换一定不可对角化
- 特征：mod 3的特征是3,mod 7的特征是7
- 对合变换: AA = I,
- 特征不等于2, 最小多项式是 $\lambda^2-1$ 的因式，因为这里特征不为2,所以 1 != -1
- 特征等于2,最小多项式是$\lambda^2-1$ 的因式，这里特征是2,所以1=-1,$(\lambda+1)^2$的因式，如果$\lambda+1$是最小多项式$A=-I=I$ 这时就是I,所以不等于I的一定不能对角化
F是复数域时，周期变换一定可对角化

命题8, r > 1的Jordan块一定不可对角化，包含级数大于1的jordan块的jordan形矩阵一定不可对角化

证明最小多项式是 $(lambda-a)^r$

推论6. A对角化，那么A的任意一个非平凡不变子空间W, A|W都可对角化

证明，也就是子空间诱导A的最小多项式是 A的最小多项式的因式，而A的最小多项式同样特征值最高幂次为1次，所以诱导的最高幂次也不会超过1次，得证

命题9 A可对角化，A的任意不变子空间W = $\oplus (V_{\lambda_i} \cap W)$的直和

由上，不变子空间特征值都是 A的特征值
- 属于 A|W的某个特征值的子空间正是对应的和W的交
- 并且 A|W可对角化，所以可以由它们的直和

命题10. A可对角化，当且仅当，特征多项式在包含F的代数封闭域中的全部n个根都在F中，且对于A的任一不变子空间W，都存在A的不变子空间作为W在V中的补空间。

9.7 幂零变换的Jordan标准型

B是幂零变换，指数为l

存在向量a, $B^{< l}a\neq 0,B^la=0$

且$a,Ba,\cdots,B^{l-1}a$线性无关（否则存在一个另一个最小式）

是子空间$<a,Ba,\cdots,B^{l-1}a>$的一个基

这个子空间是不变子空间（B(展开) = 0+表示）

在这个基下的矩阵为，$jordan(0)$ 对角右便宜1个为1

定义1. $a\in V$, $B^{t-1}a\neq 0,B^ta=0$, 那么$<B^{t-1}a,…Ba,a>$称作B-强循环子空间

是不变子空间
这些是它的一个基

定理1. B是r维线性空间W上的幂零变换，指数为l,则W能分解成 dim W_0个B-强循环子空间的直和

其中$W_0$是B的属于特征值0的特征子空间
幂零，特征值有0,所以$W_0 !=0$
dim W/W_0 = dim W - dim W_0 < r
- 商空间 $a+W_0\in W/W_0$中，诱导线性变换$B_0$, $B_0^l(a+W_0)=B_0^la+W_0=0+W_0=W_0$
  - 所以 $B_0$ 是商空间上的幂零变换
  - 归纳法，商空间可以分解成如上形式的直和
  - W = W_0 直和（归纳中上述形式的直和个数为$s = dim (W/W_0)_0$）
  - 由表示法 $\sum_i c_iB^{t_{i}}a_i = 0$ 知道这些$B^{t_i}a_i$ 在W_0中且线性无关
  - 又都是$W_0$中的，所以 $B^{t_i}a_i$ 扩充成W_0的一个基，
  - W = 上述形式每个的幂次从$B^{t_i-1}a_i$ 多一个$B^{t_i}a_i$, 以及生于扩充所用到的基
    - 这里其实如何和 W=W_0直和归纳对应着看的话
    - 那么归纳中的每一个都多一个向量，这些向量线性无关，且都属于W_0,然后W_0剩余的部分，每个向量一个强循环子空间

定理2. B是r维线性空间W上的幂零变换，幂零指数为l,W中存在一个基，使得B在此基下的矩阵B为一个Jordan形矩阵，其中每个Jordan块的主对角元都是0,级数不超过l, Jordan块总数 = dim(Ker B)=r - rank(B),t级Jordan块的个数N(t)=rank(B^{t+1})+rank(B^{t-1})-2rank(B^t)

总数 = dim W_0 = dim Ker B = r - rank(B)
rank $J_n(0)^m=max(n-m,0)$
在考虑 $B^{t-1}$ 会让小于t的 jordan块都变成零矩阵
- $rank(B^{t-1})= 1N(t)+2N(t+1)+\cdots +(l-(t-1)) N(l)$
- $rank(B^{t})= 1*N(t+1)+\cdots +(l-t) N(l)$
- $rank(B^{t-1})-rank(B^t)= N(t)+\cdots +N(l)$
- $rank(B^{t})-rank(B^{t+1})= N(t+1)+\cdots +N(l)$
- 得证

9.8 线性变换的jordan标准型

线性变换A的最小多项式m(lambda)在F[lambda]中的标准分解式为 $m(\lambda)=\prod (\lambda-\lambda_i)^{l_i}$

那么V下存在一个基，使得在此基下的矩阵A为jordan形矩阵，主对角元是全部特征值

主对角元 $\lambda_j$的Jordan块的总数$N_j=n-rank(A-\lambda_jI)$

lambda_i是所有不同特征值

$V=Ker(A-\lambda_iI)^{l_i}$的直和

令$W_i=Ker(A-\lambda_iI)^{l_i}$ ,$B_i=A|W_i-\lambda_iI$

则$B_i$是 $W_i$上的幂零变换，存在基使得B_i在W_i上是Jordan形

在这个基下诱导A 为$A_i=\lambda_iI+B_i$

$N_i=dim Ker B_i= dim Ker(A|W_i-\lambda_iI)=dim(Ker(A-\lambda_iI))=n-rank(A-\lambda_iI)$
$N_i(t)=rank(A-\lambda_iI)^{t+1}+rank(A-\lambda_iI)^{t-1}-2rank(A-\lambda_iI)^{t}$

推论2，线性变换有jordan标准形，当且仅当A的最小多项式m(lambda) 在F[lambda] 中可分解成一次因式的乘积

推论3, 线性变换有jordan标准形，当且仅当A的特征多项式m(lambda) 在F[lambda] 中可分解成一次因式的乘积

定义1. A有Jordan标准型J,那么J中所有Jordan块的最小多项式称为A的初等因子

如果有jordan标准型，那么完全有初等因子决定

推论5. $A,B\in M_n(F)$如果A,B都有Jordan标准形，那么A与B相似当且仅当A与B有相同的初等因子

推论6,两个n级复矩阵相似当且仅当它们有相同的初等因子

在复数域上所有n级矩阵组成的集合$M_n(C)$中，初等因子是相似关系下的一组完全不变量

综上所述，我们对于最小多项式m(lambda)在F[lambda]中能分解成一次因式乘积的线性变换A,通过把线性空间V分解成A的根子空间的直和，在A的每个根子空间$W_i=Ker(A-\lambda_iI)^{l_i}$ 中取一个合适的基（通过 W_i上的幂零变换$B_i=A|W_i-\lambda_iI$来找合适的基）使A|W_i在此基下的矩阵A_i为一个jordan形矩阵，把W_i的基合起来成唯V的一个基，A在V的这个基下的矩阵A=diag{A1…As}就是一个jordan形矩阵。这样求出A的最简单形式的矩阵表示的方法称为线性空间V分解成A的根子空间的直和的方法，简称为空间分解的方法。

这里要看章节7.2的定义定理3 /4, 章节7.3定义定理 6/7

定理2. 任意一个非零的n级$\lambda-$矩阵一定相抵于对角 lambda矩阵

相抵：初等行列变换
diag {$d_1(\lambda),d_2(\lambda),\cdots,d_n(\lambda)$}
其中$d_i(\lambda) | d_{i+1}(\lambda)$
对于非0的d_i,首项系数为1,
满足这些要求的矩阵称为一个相抵标准形，或Smith 标准型

定义2 $A(\lambda)$的相抵标准形中主对角线上的非零元 $d_i(\lambda)$ 称为$A(\lambda)$的不变因子

定义3 $s\times n$ $\lambda-$矩阵$A(\lambda)$ 的所有k阶子式的首一最大公因式称为A(lambda)的k阶行列式因子，记作$D_k(\lambda),1\le k \le min(s,n)$

定义4, 如果非零 $\lambda-$矩阵A($\lambda$) 有一个r阶子式不为0,而所有r+1阶子式都为0,那么称$A(\lambda)$的秩为r,零矩阵的秩规定为0

定理3, 相抵的$\lambda-$矩阵有相同的秩和相同的各阶行列式因子

$D_1(\lambda)=d_1(\lambda)$
$D_2(\lambda)=d_1(\lambda)d_2(\lambda)$
$D_r(\lambda)=\prod d_i(\lambda)$
$D_{r+1}(\lambda)=0$

因此有

$d_1(\lambda)=D_1(\lambda)$
$d_i(\lambda)=\frac{D_i(\lambda)}{D_{i-1}(\lambda)}$

定理4, 两个n级 $\lambda-$矩阵相抵，当且仅当它们有相同的不变因子，或者有相同的各阶行列式因子。

术语K上的n级矩阵A的特征矩阵$\lambda I-A$的n阶行列式因子$D_n(\lambda)$就是$\lambda I-A$的行列式$|\lambda I - A|$即A的多项式

定义5, $A(\lambda)$是$C[\lambda]$上n级非零矩阵，每个次数大于0的不变因子，分解成互不相同的一次因式方幂的乘积，所有这些一次因式的方幂（相同的必须按出现的次数计算）称为$A(\lambda)$的初等因子

定理5：C[lambda]上两个满秩矩阵，通过初等变换把A(lambda)化成对角行，然后，把主对角线上每个次数大于0的多项式分解成互不相同的一次因式的方幂的成绩，则所有这些一次因式的方幂就是A(lambda)的初等因子

定理7：复数域上两个n级矩阵的特征矩阵相抵的充分必要条件是他们有相同的不变因子，或者它们有相同的初等因子

定理8：数域K上两个n级矩阵A与B相似的充要条件是， $\lambda I-A$与$\lambda I-B$相抵

定理9：数域K上两个n级矩阵相似的充分必要条件是它们有相同的不变因子

不变因子是 $M_n(K)$在相似关系下的一组完全不变量
初等因子是$M_n(C)$在相似关系下的一组完全不变量

jordan块$J_r(a)$的 r阶行列式因子为 $D_r(\lambda)=(\lambda - a)^r$, $D_{<r}(\lambda)=1$(右上角的1)

有$d_r(\lambda)=(\lambda-a)^r, d_{<r}(\lambda)=1$

jordan矩阵，由它的每个jordan块的初等因子决定（除了顺序）

定理10：n级复矩阵A都与一个jordan形矩阵相似，这个Jordan形矩阵除去其中jordan块的排列次序外被A唯一决定，称它为jordan标准型

证明：设一个n级复矩阵的初等因子为 $(\lambda-\lambda_i)^{r_i},\cdots$ （可能有相同的特征值）
A所有初等因子的乘积等于 $\lambda I-A$的所有不变因子的成绩 = A的特征多项式，从而 jordan块阶数和 = n
每一个初等因子$(\lambda-\lambda_i)^{r_i}$决定一个Jordan块，共同组成jordan形矩阵
除了jordan块的次序外是相同的唯一的
把 J（jordan形矩阵）中所有jordan块的最小多项式成为A的初等因子，
- m(lambda) = 最小公倍数 ((lambda-lambda_i)^{r_i})
- 注意到特征值可能有相同的，因此相同时取最大的幂次

推论7： n级复矩阵 A的最小多项式 m(lambda) 扥远古A的最后一个不变因子 d_n(lambda)

推论8：数域K上n级矩阵 A的最小多项式m(lambda)等于A的最后一个不变因子d_n(lambda)

推论9: 数域K上n级矩阵A 和矩阵B 相似，当且仅当把它们堪称复矩阵后相似

也就是不变因子，在看成复矩阵后，还是同样的不变因子
<=> A与B有相同的不变因子
<=> A与B堪称复矩阵后相似

定义6 设A是域F上n维线性空间V上的线性变换，如果A在V的一个基下的矩阵是Jordan形矩阵，那么称这个基成为A的一个Jordan基

如何求jordan基
A和B相似: $A=P^{-1}BP$, 有$\lambda I-A=P^{-1}(\lambda I - B)P$ 这两个相抵
- 存在可逆 $\lambda-$矩阵$P(\lambda),Q(\lambda)$
- $\lambda I - A= P(\lambda)(\lambda I - B)Q(\lambda)$
  - $P^{-1}(\lambda)(\lambda I - A)=(\lambda I - B)Q(\lambda)$

引理1 设A是域F上的任一非零矩阵，G(\lambda)是任意一个n级lambda-矩阵，则存在n级\lambda-矩阵$H_1(\lambda),H_2(\lambda)$ 和域F上n级矩阵$T_1,T_2$使得

$G(\lambda)=H_1(\lambda)(\lambda I - A) + T_1$
$G(\lambda)=(\lambda I - A)H_2(\lambda) + T_2$
- 证明按照$\lambda$的幂次，把G(\lambda)拆开成和$G(\lambda)=\sum_{i=0}^m \lambda^i G_i(\lambda)$, 最高次$G_m(\lambda)$ 不是零矩阵
- 上面的 $H_1$ 最高次就是$m-1$,可以$H_1$同样的方式按照幂次展开，$H_1(\lambda)=\sum_{i=0}^{m-1} \lambda^i B_i(\lambda)$
  - 幂次对应相等有 $B_{m-1}=G_m$, $B_{i\le m-2}=G_{i+1}+B_{i+1}A$, $T_1=G_0+B_0A$ 所以有方法表示
  - 同理可以正民有 $H_2,T_2$

定理11. 域F上两个n级矩阵A与B相似当且仅当$\lambda I - A$与$\lambda I -B$相抵
- 若相抵，则存在$P,Q$ 使得$\lambda I -A=P(\lambda I -B)Q$
- 根据引理
- $Q=H_1(\lambda I -A)+T_1$
- $P=(\lambda I -A)H_2+T_2$
- $P^{-1}(\lambda I-A)=(\lambda I - B)(H_1(\lambda I - A) +T_1)$ 带入得
- $(P^{-1}-(\lambda I -B)H_1)(\lambda I -A)=(\lambda I -B)T_1$, 右侧幂次为1或0,左右左侧的左边因子 lambda幂次为0
- $S= P^{-1}-(\lambda I -B)H_1$
- $I=PP^{-1}=P(S+(\lambda I-B)H_1)$
- $=((\lambda I - A)H_2+T_2)S+(\lambda I-A)Q^{-1}H_1$
- $=T_2S+(\lambda I -A)(H_2S+Q^{-1}H_1)$ // 这里注意到lambda的幂次，所以$H_2S+Q^{-1}H_1=0$
- 所以 $I=T_2S$, 从而S是可逆矩阵
- $\lambda I - B=S^{-1}(\lambda I - A)T_1=\lambda S^{-1}T_1-S^{-1}AT_1$ 同样 lambda的幂次对应相等
- 有 $I=S^{-1}T_1,B=S^{-1}AT_1$
- 即$B=S^{-1}AS$

例子： A=[-1,1,0;-4,3,0;1,0,2]

行列式因子

$D_3(\lambda) = |\lambda I - A|=(\lambda-2)(\lambda-1)^2$
$D_2(\lambda)=1$ 这种随便取几个很快得到1
$D_1(\lambda)=1$ 这种随便取几个很快得到1

不变因子

$d_1(\lambda)=D_1(\lambda)=1$
$d_2(\lambda)=D_2(\lambda)/D_1(\lambda)=1$
$d_3(\lambda)=D_3(\lambda)/D_2(\lambda)=(\lambda-2)(\lambda-1)^2$

初等因子

$(\lambda -2)$
$(\lambda -1)^2$

Jordan标准型

= diag(J_2(1),J_1(2))
1 1
  1
    2

9.9 线性变换的有理标准型

最小多项式，在F[lambda]中不能分解成一次因式的乘积，那么A的最简单形式的矩阵表示是什么样呢？

9.10 线性函数与对偶空间

V是域F上的线性空间，由于域F可以看成自身上的线性空间，因此自然可以考虑线性空间V到F的线性映射，我们把这种线性映射称为V上的线性函数

定义1. V是域上线性空间，V到F的一个映射f如果满足

f(a+b)=f(a)+f(b),$a,b\in V$
f(ka)=kf(a), $a\in V, k \in F$
那么称f是V的一个线性函数

例如 trace函数，有线性加和数量乘

线性函数空间

dim Hom(V,F)=(dim V)(dim F)=n * 1 = n

设V的一个基是 $a_1,\cdots,a_n$

$\sigma: Hom(V,F)\to F^n, f\to (f(a_1),\cdots,f(a_n))$
$\sigma^{-1}$也是一个同构映射
- $F^n$中取标准基$\epsilon_1,\cdots,\epsilon_n$
  - $\sigma^{-1}(\epsilon_1),\cdots,\sigma^{-1}(\epsilon_n)$ 是Hom中的一个基，称作对偶基， Hom(V,F)称为V的对偶空间记作$V^*$

定理1 V是域F上的n维线性空间

取两组基a_i,b_i,那么$V^*$中相应的对偶基有f_i,g_i
a1->b1的过度矩阵为A,那么f_i->g_i的过度矩阵$B=(A^{-1})^T$
- 证明
- (b_i)=(a_i)A
- $(a_i)=(b_i)A^{-1}$
- $(g_i)=(f_i)B$
- 注意到 Y = base x 的意义可以看成Y的j列的第i个分量，在 base基下的坐标是 x[i,j]
- $A^{-1}[i,j]=g_i(a_j)=B[j;i]=B^T[i;j]$

总结

9.1 幂等，投影，与线性映射本身也是一种线性空间
9.2 线性映射过程中：投影的结果是 0 的源叫做核Ker A，dim V/(Ker A) = dim (Im A), 其子空间关系
9.3 用矩阵来表示，建立变换 <=> 矩阵的关系，所有变换构成的线性空间和矩阵构成的线性空间的同构
- 一个具体变换，在不同基选择下，对应的矩阵是相似的！！！
- 这是一个找相似矩阵的最简单形式的好理由
9.4 从这个引入特征向量和特征值
9.5 不变子空间（任意子空间内向量经过线性变换A后依然属于子空间）
- 对于可对角化的表示成特征子空间直和，注意到这些特征子空间中的向量经过变化后还是在特征子空间中，考虑引出不变子空间
  - 0,V 这两个都是平凡不变子空间（显然的）
  - Ker 和 Im 也是不变子空间
  - 特征子空间也是不变子空间
- 关系的研究主要通过向量通过基的表示法
- 多项式可以拆分成互素子多项式的乘积，那么多项式的Ker也可以拆成对应子多项式Ker 的直和
- 零化多项式 f(A)=0
- Hamiton-Cayley 特征多项式是 A的一个零化多项式
9.6 最小多项式
- 零化多项式，最小，
- 是特征多项式的因式，唯一
- 特殊的零化多项式和 jordan块
9.7 幂零变换的jordan标准型
- 结构是强循环子空间: 取这样的基可以产生 jordan块，
  - 可以分解成 dim W_0(特征值0的子空间)各强循环子空间的直和
- 一般的是由jordan块拼成的对角
9.8 线性变换的jordan标准形
- $\lambda I - A$, 最小多项式与幂零建立联系，从而建立线性变换和jordan块的联系
- 初等因子
- 不变因子（相抵标准型主对角线） d_i
- k阶行列式因子, D_i

脉络

这里其实就是，对角化（并不通用）
观察对角化表示成特征子空间的直和
- 对角化是 n个线性无关的向量
也就是希望有一个基，在这个基下的变换矩阵比较简单
如果能变成这在矩阵书写形状上是对角分块，那么可以变成块之间的直和
而分块的意义就是“不变子空间”
- 那么去哪里找这些不变子空间
- 另一个启发是， AB=BA (如果可交换，那么ker B是A的不变子空间)
  - 那么可以考虑 A的幂次, => A的多项式， F[A]={A的多项式} \in Hom(V,V)，是交换环
  - 所以任何一个多项式 F[A]的 Ker 是A的不变子空间
- 互素 f1,f2 以及f=f1f2 => 从而 uf1+vf2=I => 从而可以去想 ker f = ker f1 + ker f2 通过表示法，和直和定义（交空，和能表示所有）
  - 再归纳法，拓展到f=多个互素多项式的乘积，这样 ker f = ker fi 的直和
  - 我们希望整个V 分解成成A的不变子空间的直和
  - V = ker ? => 直和拆解
    - 而 ker 0 = V 引出零变换（V的每个向量的映射到 0），和零化多项式
- f(A)=0 零化多项式 f[x]带入A
  - 矩阵和线性变换同构，可以研究矩阵，线性变换零化多项式<=> 矩阵零化多项式
  - 一定存在：抽屉原理 A^{n^2} 可得总能线性相关
  - gcd辗转相除得到有最小，和都是倍数的性质
  - Hamiton-Cayley 特征多项式是 A的一个零化多项式
    - 书上是一个伴随矩阵强行代数，然后的对应位置相等来完成证明了，视频是105，没有什么感受
    - 搜了下知乎和google, 一个观点是，可对角化=>n个不同向量 f(A)ai=f(lambda i)ai=0 所以是零化多项式, 然后可对角化稠密+连续性 => 不可对角化可以趋近，所以不可对角化也是零化多项式
    - V = ker f(A) = ker $A-\lambda_i I$ 们的直和，而特征多项式可以分解成方幂的乘积
- 希望有各更“临界的状态”，希望有个临界的零化多项式，而不只是特征多项式，同时和特征多项式建立联系
- 引出最小零化多项式m(\lambda)，（为了唯一让最高次系数为1）
  - 又是带余除法那一套，证明唯一性，倍数性
  - 和特征多项式关系，倍数性质，根显然也是特征多项式根，而特征多项式根对应特征向量有 m(lambda_i)a_i=(展开)a_i=替换成A=m(A)a_i=0a_i=0, 说明了两边根相同（重数不保证）
- 根据之前的两个矩阵相似，可以看成同一个线性变换，在不同基下的变换矩阵
  - 矩阵A 和变换A 的最小多项式相同
  - 矩阵B 和变换A 的最小多项式相同
    - 所以相似矩阵最小多项式相同
- V=Wi们的直和
  - 每个W_i的最小多项式是m_i(lambda)
  - 可以证明 V的最小多项式是 m_i(lambda)的倍数（通过零化关系证明）
    - 所以V的最小多项式是所有m_i的最小公倍数的倍数
    - 这边用两边集合互相包含来证明相等得到是最小公倍数。 {零化多项式} 互相包含 {m_i公倍数}
    - 感觉似乎可以直接推至少的幂次吗？吧？
  - 结论就是 V=W_i们的直和，那么m()=lcm(m_i)
    - 从书写上，就是对角分块，的每个分块的最小多项式的 lcm
- 那么接下来就是研究具体的小块的最小多项式了
  - 复杂的难观察，先观察幂零变换，有特点是幂次l时=0, 小于l时非0
  - $f(\lambda)=\lambda^l$
  - 可对角化 <=> 可分解成不同特征值的子空间的直和
    - 因为向量属于特征值$\lambda_i$的特征子空间中，当且仅当它属于 ker $A-\lambda_i I$，所以有 $V_{\lambda_i}=Ker (A-\lambda_i I)$
      - $\lambda-\lambda_i$是$A|V_{\lambda_i}$的一个零化多项式
      - 即特征子空间的零化多项式lambda最高幂次为1
    - 所以 V = Ker(A-\lambda_i I) 们的直和
    - 可对角化 <=> 最小多项式每个特征值对应$\lambda-\lambda_i$最高幂次为1 , <- 一个有用的结论
      - 推论如果有幂次 > 1则一定不可以对角化
      - 例子幂等可对角化，最小多项式 lambda(lambda-1) 的因式
  - $m(\lambda)=\prod_i (\lambda-\lambda_i)^{l_i}$, 其中特征值两两不同，这里$l_i$ 表示原始矩阵的最小多项式的对应特征值的幂次
    - V= Ker $((A-\lambda_i I)^{l_i})$ 们的直和（分块对角矩阵）
    - 下个目标就是
      - 希望对于 $(A-\lambda_i I)^{l_i}$中找到一个基，使得在这个基下的坐标尽量简单
      - 如何求 m_i(lambda)：
        
        找一个零化多项式，然后让它尽量小
      - $\forall a_j\in W_i=Ker((A-\lambda_i I)^{l_i})$ 有$(A|W_i-\lambda_i I)^{l_i}a_j=(A-\lambda_i I)^{l_i}a_j=0$
        
        所以 $(\lambda-\lambda_i)^{l_i}$ 是零化多项式，因为（上面把$A|W_i$带进入是零多项式）
        
        证明最小：和m()中分解出的m_i中的幂次一致
        
        $B_i=A|W_i-\lambda_i I$, 是$W_i$上的幂零变换，幂次为$l_i$
  - 引出问题：幂零变换在什么样的基最简形式，如果找到的话，$A|W_i=B_i+\lambda_i I$, 也就是最简单形式 + 对角线的lambda
    - 注意到$B^{l_i}=0,B^{<l_i}\neq 0$,所以存在 $a\in W_i$, $a,Ba,\cdots,B^{l_i-1}a$线性无关
      - 因为 $\sum k_jB^ja=0$ 只有$k_j=0$零解（证明, 左边同时乘以$B^{l_i-1}$ 可以得到 $k_j=0$, 反复降低乘的幂次可得所有k是0
      - 所以可以选作一组基
      - 同时也是不变子空间
      - B 在基 {$B^{l-1}a,\cdots,Ba,a$ } 下的矩阵为对角线右移一位全1,其它地方全1的矩阵 = Jordan_{l}(0)
        
        也就是前面学的变换B (基)=基 * 矩阵B
        
        定义 a,Aa,…A^{t-1}a 线性无关, $A^t$ 属于它们的生成空间
        
        那么称作循环子空间
        
        如果$A^t=0$ 称作强循环子空间
    - 希望把对于是r维线性空间V的幂零变换B,希望把W分解成与 B-强循环子空间有关的直和
      - 对于空间的维数大小，用数学归纳法
        
        1维 <基>
        
        n维（这个构造的思路怎么冒出来的），小于n维可分解，对于幂零变换B，幂零指数为l
        
        l=1, 那么W分解成每个基向量子空间的直和
        
        也就是B=0, $B^1a=0^1a=0$ 所以每个基向量的子空间是 0-强循环子空间
        
        l > 1, $B\neq 0$, 有特征值, B的基于特征值0的特征子空间，$W_0\neq 0$
        
        $1\le dim W/W_0 =dim W - dim W_0 < dim W = r$
        
        dim W/W_0 可以拆成
        
        每个拆的多一个 $B^{幂次_i+1}a_i$
        
        一方面在W中它们线性无关，一方面这些都是W_0中的，什么感觉呢 W=W_0直和 V, 然后V是可以拆分成强循环的直和的，很巧V中每个强循环的增加一个幂次，都在W_0中，又线性无关，那么W_0就可以拆分成它们以及扩充的基，这样总个数就是W_0各强循环，这里的“强”（也就是幂次增1会让结果是0)保证了每个多一个幂次都在$W_0$中，
        
        个数是 dim W_0个
    - 所以有空间V和幂零变换B（上面选择的是Ker) 然后就可以拆直和，（既然是直和，那么完成了拆分+填满）
      - 幂零矩阵相似于 jordan形矩阵
      - $B_i=A|W_i-\lambda_i I$ 是一个$W_i$上的幂零变换, 然后V取所有$W_i$对应基组成的，为jordan形矩阵
    - 如果最小多项式，变换某个乘项幂次更大，根据拆分还是同样的基
      - 那么我们就不一定要找最小多项式了，而是找特征多项式
      - $N_i=dim Ker(A|W_i-\lambda I ) = n-rank(A-\lambda_i I)$
最终证明是jordan型，表示成特征子空间直和（可能有重复的特征值）
- 而jordan型是所有都可以，那么对角化只是jordan型的一种特例