高等代数 十 具有度量的线性空间

视频121-144

具有度量的线性空间

考虑在线性空间中 增加长度而概念

10.1 双线性函数

a,b是向量,内积: $a\cdot b = |a||b| cos<a,b>$, ,内积有一 加法乘法 分配,数量乘法,于是在内积之前,引进 双线性函数

定义1. 设V是域F上的一个线性空间V, VxV到F的一个映射f, 如果满足一切的 a1,a2,a,b1,b2,b \in V, k1,k2 \in F 有

  • $f(k_1a_1+k_2a_2,b)=k_1f(a_1,b)+k_2(a_2,b)$
  • $f(a,k_1b_1+k_2b_2)=k_1f(a,b_1)+k_2(a,b_2)$
  • 那么成为是V上的双线性函数
    • 说白了就是,两个入参,都可以“线性”拆开,而之前学的主要是入参只有一个(可以线性拆开),而之前的如果固定一个入参,那么也是线性函数

f(a,b)=f(按照基展开成$\sum$,按基展开成$\sum$)

$=\sum \sum a在基下的每个坐标*b在基下的每个坐标 * f(每个基向量,每个基向量)$

(a的坐标行向量) (n * n 的f(每个基向量,每个基向量)的矩阵) * (b的坐标列向量),

那么 中间这个矩阵 称作 f在 给定基 下的 “度量矩阵”


反过来,对于$A\in M_n(F)$, 那么 可以构造一个$f(a,b)=X^TAY$ 就构造出一个双线性函数,(这里和前面不同的是,这里的 基 和 A决定f的,而前面是 f 和 基 决定 A)


定理1. f是域F上的n维线性空间V上的双线性函数,基b=基a * 矩阵C

  • 在基a下的度量矩阵是A
  • 在基b下的度量矩阵为B
  • B = (f(bi,bj)) 矩阵 = ( (c的i列 行向量)A(c的j列 列向量) ) = $C^TAC$, C是可逆的 , rank(A)=rank(B)
  • 称 A与B是合同的, 也就是合同意味着同一个双线性函数在不同的基下的度量矩阵
    • 自反,对称,传递 => 所以合同是一种等价关系
    • 之前 相似:同一个线性变换 在不同的基下是相似的$B=S^{-1}AS$
  • $rank_{matrix}(f)$ 双线性函数的矩阵秩

定义3

  • 左根 $rad_LV=$ {$a \in V | f(a,b)=0, \forall b\in V$}, 是V的一个子空间
  • 右根 $rad_RV=$ {$b \in V | f(a,b)=0, \forall a\in V$}, 是V的一个子空间

定义4: V上的双线性函数f在V中的左根和右根都是0子空间,则称f是非退化的

  • 左右根只有0解,那么 rank(V)=n

对称双线性函数 f(x,y)=f(y,x) 显然 矩阵是对称矩阵

  • 斜对称,反对称 f(x,y)=-f(y,x) skew

同样,希望能选择一组好的基,让度量矩阵尽量简单


对于 “内积函数”的度量矩阵来说,如果选取了两两垂直的基来说,可以只有主对角线非零

那么如何找两两垂直的基,对于任意找的基a,b,可以b=b-(b在a方向的投影),来到了(mit讲过的投影矩阵,然后写法上还有“点乘”,没有直接的矩阵乘法,这点感觉还是mit更好)


定理1. 对称双线性函数f,特征不为2,存在一个基,使得度量矩阵是 对角矩阵

  • f=0 零函数是对称
  • $f\neq 0$
    • 若任何f(a,a)=0,有 0=f(a+b,a+b)=f(a,a)+2f(a,b)+f(b,b) 即 f(a,b)=0, (这里需要特征不为2)
    • 所以存在$a, f(a,a) \neq 0$, 然后所有和a投影减去,变成子空间子问题,这里其实就是任选基中 完成一个基的等价变换,而剩余的span成的空间 和 a 的直和 = 原来空间

推论1. 特征不为2 的 域F上的n级对称矩阵A 合同于 一个对角矩阵A

  • 合同标准型

定理2. f是特征不为2的 反/斜对称 矩阵 双线性函数,则V中存在一个基,使得f在此基下的度量矩阵是形如下述的分块对角矩阵

  • 多个 [0,1;-1,0]的对角块

推论2, 特征不为2的域F上的 斜对称矩阵一定相似于


几何空间 内积 a * a >= 0, 等号成立当且仅当 a=0

定义1. 实数域上的线性空间V上的对称双线性函数f, 对于任意 向量a,有 $f(a,a)\ge 0$, 等号成立当且仅当 a=0

  • 称f是 正定的

命题1. n维实线性空间V上的对称双线性函数f是正定的:

  • 当且仅当, f在V的一个基下的 度量矩阵A 满足
    • A是对称矩阵,且 任意x, $x^TAx \ge 0$, 等号成立当且仅当x=0

定义2. n级是对称矩阵A,若满足x!=0, $x^TAx >0$ 则A是正定对称矩阵,简称正定矩阵

定义3. 实线性空间V上的一个 正定的对称双线性函数f 称为V上的一个 内积

若是线性空间V,指定了一个内积,则称V是一个 实内积空间

有限维的 实内积空间 成为 欧几里得空间

10.2 欧几里得空间

例1. 任给x,y, $f(x,y)=x^Ty=x^TIy$

  • 也就是在 基$\epsilon_{1\cdots n}$的坐标
  • 是$R^n$上的一个双线性函数
  • 称它为 标准内积

设V是实内积空间,

定义4 V中向量a的长度 $|a|=\sqrt {f(a,a)}$

  • 根据 双线性函数性质,可证 $|ka|=|k||a|, k\in R,a\in V$
  • |a|=1称$a$为 单位向量
    • $a\neq 0$, 则 $\frac{1}{|a|}a$ 是一个 单位向量

几何空间 $a,b$ 的$cos<a,b>=\frac{f(a,b)}{|a||b|}$

定理1. Cauchy-(俄文不会写)-Schwarz 不等式)

  • $|f(a,b)|\le |a||b|$, 等号成立 当且仅当 a,b 线性相关
    • 一个是零向量时,(0,a)时证明
    • (a,ka)时证明
    • 对于不相关时 0 < f(ta-b,ta-b)= 关于t的二次多项式
      • 说明判别式 < 0
      • 得到 上面的要证的部分

定义5 a,b 不等于0, <a,b> = arcos (f(a,b)/(|a||b|))

  • 夹角 pi/2 <=> f(a,b)=0

定义6, f(a,b)=0, 称a与b正交

定义7. a与b的距离 d(a,b) = |a-b|

  • 可以验证 d(a,b)=d(b,a)
  • $d(a,b) \le d(a,c)+d(c,b)$ 三角不等式

推论, a,b正交,则 $|a+b|^2=|a|^2+|b|^2$ 勾股定理

  • 的确在 向量空间里这些证明起来是快了不少

命题1. 实内积空间V中,由 两两正交的非零向量 组成的集合S一定是线性无关的

  • 证, 任取S的一个有限子集 { $a_1,\cdots,a_n$ }
    • $f(a_j,\sum k_ia_i)=0$, 可证明 所有系数只能取0

n维欧几里得空间中,n个两两正交非零向量 是一个基,称作V的一个正交基

  • 再加上单位向量,就是 标准正交基

定理1. [a...] 线性无关的向量组

  • 然后 就开始 schmidt正交化了,很自然的逐个减去投影
  • 主要的是证明 可线性表出?
    • 一点点归纳的感觉

推论2. 一定有 标准准正交基

  • 取基
  • schmidt 正交化
  • 单位化 所有基向量

内积 在给定基 下的度量矩阵,称为 基a_{1..n}的度量矩阵


这里的最重要的是 定义度量矩阵,即使不是常见的点积,也有对应的 长度等的定义

性质1. $f(a,b)=x^TIy$

性质2. v在 标准基$a_i$ 下的第i各坐标为 $f(v, a_i)$, 这里有了用 标准正交基 和 内积 来反求坐标的下标

定理2. $a_i$ 是n维欧几里得空间的一个标准正交基

  • (b_i) = (a_i) P
  • 如果 (b_i) 是一个 标准正交基
    • <=> P的性质,$P^TP=I$,P是正交矩阵

性质1,I是正交矩阵

性质2,正交矩阵的乘积还是正交矩阵

  • $(AB)^T(AB)=I$

性质3. A是正交矩阵,$A^{-1}=A^T$是正交矩阵

性质4. 正交矩阵 |A| = 1或-1

10.3 正交补,正交投影

定义2,S是实内积空间的一个非空子集

  • S的正交补 = {$a\in V| f(a,b)=0, \forall b \in S$}
  • 它 也是 实内积空间
  • 注意 这里 S并不要求S是子空间
    • 但从感觉上 和 span< S > 就和 之前的直和感觉一样了

定理3. 设U是实内积空间V的一个 有限维子空间

  • 则 V 能表示成 U 和 U的正交补 的直和

正交投影: $P_U(a)=a$在空间U的投影, 也就是拆直和时的表示

定理4. a 和 a到U的正交投影,是a到U所有向量的距离是最短的

定义2. a 到 U中最近的向量,称作 a 到 U中最佳逼近元

定义3,设V与V’ 都是 实内积空间, 如果 V,V’之间有双射,且保持 加法,数量乘法,内积

  • 那么 是 保距同构(线性同构+内积同构)
    • 把V的一个标准正交基 映成V’的一个标准正交基

定理5. 两个欧几里得空间同构

  • <=> 有相同的维数
  • <=> 本质上就是$R^n$

10.4 正交变换与对称变换

定义1. A是实内积空间V上的一个变换

  • 如果A是满射,满足:保持内积不变 f(Aa,Ab)=f(a,b)
  • 那么A是一个V上的一个 正交变换

性质, A是 实内积 空间V上的正交变换

  • |Aa|=|a|
  • < Aa,Ab > = < a,b >,
  • 保持 垂直
  • 正交变换 一定是线性变换
    • 想证明 保持 A(a+b)=Aa+Ab, 可以 去证明$|A(a+b)-Aa-Ab|^2=0$
    • 类似的 证明 A(ka)=kAa
  • Ker A =0 所以是单射,加上满射 所以是双射
  • 内积不变 距离不变
  • <=> 到自身的同构映射,保距的

正交变换的乘积还是正交变换

命题3. 对于有限维,保持内积,那么是V上的一个正交变换

  • 保持内积 f(Aa,Ab)=f(a,b)

正交变换

  • 把V的标准正交基 映成标准正交基
  • 正交变换 在 标准正交基 下 是 正交矩阵

定理2 A是n维欧几里得空间V上的正交变换,则V中存在一个标准正交基,使得A在此基下的矩阵为下属形式 分块对角矩阵

  • 小块是 [cos,-sin;sin, cos], 非小块的对角是 特征值对角

定义1. A是实内积空间V上的一个变换,如果A对于任意a,b有

  • f(Aa,b)=f(a,Ab) 那么称A是一个对称变换
  • 例如 投影变换

命题1. 实内积空间上的 对称变换A,一定是线性变换

命题2 n维欧几里得空间V上的一个线性变换是 对称变换

  • A在V的一个标准正交基下的矩阵
  • $a_{ij}=f(A基_j,基_i)$
    • 如果A是对称变换 f(变换A a,b)=f(a,变换A b)
    • 即 $a_{ij}=f(基_j,A基i)$
    • $a_{ij}=a_{ji}$ 也就是 在标准正交基下矩阵是对称矩阵

命题3. n级实对称矩阵A 的 特征多项式 f(x)的复根都是实数

  • 这里老师强调,实数域上的特征值 肯定是实数,而特征多项式的复根(如果有复数根,也不能称作它的复根,因为域的定义是在实数上)都是实数
    • 很多教材 在域上的描述出现了问题
  • 证明 看成 复域上矩阵 $\lambda a^T\bar{a}=(Aa)^T\bar{a}=a^TA^T\bar{a}=a^TA\bar{a}=a^T(A\bar{a})=a^T(\bar{\lambda}\bar{a})=\bar{\lambda}a^T\bar{a}$

命题4. n级实对称矩阵A,不同特征值的特征向量是正交的

  • 类似上面,构造$\lambda_0a_0^Ta_1=\lambda_1a_0^Ta_1$
  • 这里 其实 就是 点积,mit 上更多是 $a^Tb$, 这里清华的是 f(a,b)

命题5. 设A是实内积空间V上的一个对称变换,如果W是A的一个不变子空间,那么W的正交补也一定是A的一个不变子空间

定理1. 设A是n维 欧几里得空间V 上的一个对称变换,则V中存在一个标准正交基,使它是对角矩阵

  • 证明 对维数做数学归纳法
  • 找单位特征向量,构成子空间,正交补也是不变子空间
    • 对正交补 归纳法,出来的 基和特征 都可以和前面的单位特征向量正交,组成标准正交基,也有 特征值构成对角

推论1. A是实对称矩阵,存在正交矩阵Q

  • $Q^{-1}AQ=$对角矩阵, 此时称 A正交相似于对角矩阵
  • 如何求Q
    • 求$|\lambda I - A|$的所有不同根(一定是实数)
    • 对于每个特征值,求 $(\lambda_i I-A)X=0$的基础解系
      • schmidt正交化

10.5 酉空间,酉变换,Hermite变换,正规变换

复内积空间

f(ia,ia)=-f(a,a), 这个和正定性矛盾

这里讲的修改看得一头包,感觉还是 f(x,x) = |x|

那么如果x=a+bi, 则需要 $x^Hx = |x|$

这样就更自然 $f(x,y)=x^Hy$,验证一下是双线性即可

然后观察矩阵 $A^H=A$ ,也就是$\overline{A^T}=A$

性质

  • $f(a,b)=\overline{f(b,a)}$
  • 第一个变量线性, 但注意乘法 $k\in C$
  • f(a,a) >=0 等号成立当且仅当 a=0 (正定性
  • 那么称它是V上的一个内积

酉(Unitary)空间 = 复 线性空间 + 指定内积

可推出

  • 对第二个变量,半线性
  • 加法线性,但乘上k,是提出来$\bar{k}$
  • $f(a,kb)=\bar{k}f(a,b)$ 一个半线性函数

定义

  • 长度 = sqrt(f(a,b))
  • 定义夹角 cos = |f(a,b)|/(|a||b|)
    • 同样 要证明其范围 $\in [0,1]$
    • 一样的思路,先证明线性相关
    • 然后 $0 < f(a+tb,a+tb)=|a|^2+\bar{t}f(a,b)+t\overline{f(a,b)}+t\bar{t}|b|^2$
    • 这里不能用 判别式,然后 drop from sky了一个
      • $t=-\frac{f(a,b)}{|b|^2}$, 其实想法就是 把4项变2项,然后 导出 $|a||b| > |f(a,b)|$
      • $0 \le <a,b> \le \pi/2$, 在物理里面有的用于 概率 而不是夹角(量子力学中应用小天地)
  • 在酉空间中
    • 有了三角不等式
    • 勾股定理
    • 距离

研究 酉空间结构

  • n维酉空间 的标准正交基,
  • 命题1. 酉空间V中 两两正交的非零向量,组成的集合是 线性无关
  • 定义4. n维 酉空间V中,n个两两正交的非零向量成为V的一个正交基,
    • 如果都是单位向量 ,则标准正交基
  • 然后像上面提到的特殊的 $f(x,y)=y^Hx$ 称它为标准内积

定理2. n维 酉空间V上一定有标准正交基

  • V中取 基 => schmidt正交化 => 单位化

定理3. n维酉空间V的一个组标准正交基(a_i), (b_i)

  • $f(a,b)=y^Hx$, 在a,b同个标准正交基下的坐标,对于内积容易计算
  • (b_i)=(a_i) 矩阵P
    • 那么 $I=B^HB=(AP)^H(AP)=P^HA^HAP=P^HP$
  • 说明 两个标准正交基的过度矩阵是 酉矩阵
    • 酉矩阵 和 单位矩阵区别就是 一个是转置,一个是转置+共轭

正交补

  • 定理4. U是酉空间中有限维子空间,则V可以分解成U和U的正交补 的直和
  • 有直和拆分,就可以定义正交投影(拆成 两个直和空间的唯一和),
    • 然后 性质 到U中的投影距离最短

定义6. 酉空间V中的子空间U,a到U中最短的,称作a的最佳逼近元

  • 上面 的正交投影 <=> 最佳逼近

定义7. 设V是复(实)内积空间

  • 若V中每一个Cauchy序列 (距离可以定义极限),都在V中有极限,则成V是一个 Hilbert空间
    • 完备化(取极限)

定理5. V是一个Hilbert空间

  • 若U是V的一个闭子空间
  • 则V中任一向量a在U上都有最佳逼近元,从而V=U直和 U的正交补
    • 证明: 见群表示论, 6.9

两个有限维酉空间同构 => 保持加法 数量乘法 内积,(线性同构+保距)

  • 充要条件: 维数相同

定义1. 酉空间V上的一个变换A如果是满射,且满足保持内积,那么称,A是V上的一个酉变换

命题1. 酉空间V上的变换

  • <=> A是V到自身的一个同构映射

命题2. n维酉空间V上的变换 A

  • 若(Aa,Ab)=(a,b) 则是V上的一个酉变换

命题3. n维酉空间V上的酉变换A的特征值性质:

  • 模为1 : $f(a,a)=f(Aa,Aa)=f(\lambda a,\lambda a)=()^H()=|\lambda|^2f(a,a)$

命题4. A是酉空间V上的一个酉变换,W是A的一个不变子空间,则 W的正交补,也是A的一个不变子空间

  • 任取 b \in W正交补,要证明 任意a\in W, f(Ab,a)=0, 也就是b经过变换后依然在正交补里
    • W中A|W 单射,满射,找原相c。f(Ab,a)=f(Ab,Ac)=f(b,c)=0

定理1. A是n维酉空间V上一个有变化内,则V中存在一个标准正交基,使得A在基下的矩阵是对角矩阵

  • 对于 维数 归纳法
    • 特征值 单位向量,子空间,正交补,归纳

推论1. n级酉矩阵A

  • $A=Q^{H}\Lambda Q$, (酉相似)于对角矩阵, 注意这里是酉相似不是正交相似 $^H$

Hermite 变换:相当于实内积空间的对称变换

  • 一定是线性变换
  • f(Aa,b)=f(a,Ab)
    • 思路一样,把a,b换成正交基中的向量,从而证明$A^H=A$,, (充要的)
    • 此时称A是一个 Hermite矩阵 或 自伴矩阵

命题3。 n维酉空间上的 Hermite 变换 的特征值

命题4。类似的,不变子空间的正交补也是不不变子空间


10.6 正交空间与辛空间

物理空间中:

(t,x,y,z)

  • 宏观低速 Calieo时空变换 保持内积 $R^4$
  • 接近光速 的 Lorentz 变换 不保持 内积
    • 新内积 $f(a,b)=-c^2t_1t_2+x_1x_2+y_1y_2+z_1z_2$
    • 是一个非退化的 对称双线性函数
    • 称作 Mikowski 空间(俄国数学家)
      • $\sigma$是 不同坐标系中的映射
      • $f(\sigma(a),\sigma(b))=f(a,b)$ 保持新的内积
      • $f(a-b,a-b)$称为 a与b的时空间隔平方

定义1. 域F上线性空间V的一个非退化对称化 双线性函数f

  • 称为V上的一个内积
  • 没有正定性,没有夹角,有正交性

指定了一个内积的域F上的线性空间V 为一个正交空间

辛空间:(反对称)

10.7 正交群,酉群,辛群

TODO 视频课没有

速览

有一说一,这课在一些抽象程度上比MIT更抽象化,挺好,但是在符号使用上,MIT的$Q,\Lambda$ 带来的体验更好

  • 注意到的是
    • 这里定义的“内积”和“常用的内积”是不一样的,这里只要求一些关系,而“常用的内积”是 其中一个特例 称作“标准内积”
    • 如果描述有n维,那么意思是“有限维”
  • 双线性函数 f(a,b) = a,b都是向量,可以线性拆到f外
    • 从而 引出 $f(a,b)=x^TAy$,
    • 其中x,y是a,b在所选基下的坐标
    • 而A叫做度量矩阵
  • 实线性空间V上的一个 正定的对称双线性函数f 称为V上的一个 内积
    • 若是线性空间V,指定了一个内积,则称V是一个 实内积空间
    • 有限维的 实内积空间 成为 欧几里得空间
    • 而 定义了内积f(a,b),也就基于内积定义了长度,和前面线性空间 相比 多了内积,在研究同构时,会需要内积相等 f(变换A a,变换A b) = f(a,b)
  • 正交矩阵:
    • $Q^{T}Q=I$
    • a到 a在U的投影 距离最短
    • 正交补: 类似于之前的 直和的补的部分,但原始的不要求是空间,(其实可以span一下)
  • 正交变换
    • 定义是保持 内积
    • 性质是,变换矩阵 是 正交矩阵,空间效果就是无放缩的旋转
    • 最优基下的表示是 对角分块的 小旋转标准型 [cos,-sin;sin,cos]
  • 对称变换
    • 定义是 f(变换A a,b)=f(a,变换A b)
    • 性质是,对应矩阵 是 实对称矩阵
    • 特征多项式的 复解 全是实数
    • 特点是 $A=Q^{-1}\Lambda Q$,其中Q是标准正交矩阵
    • 求法 和 之前 对角化类似,只是需要标准正交化
  • 酉空间
    • 这玩意儿 有啥可视化方法吗?
    • = 复 线性空间 + 指定的 Hermite性 的内积
    • 其核心就是 从实 变 复,然后内积的定义要变一下
    • 然后对应照搬很多前面正交变换相关的内容
    • 酉变换,也就是 复线性空间保距 的变换(某种旋转)
  • Hermite变换 (相对于 实空间的对称变换)
    • 类似的定义和性质
    • 特征值 全是实数
    • $A=Q^{H}\Lambda Q$