线性代数笔记(二十四)——马尔科夫矩阵,傅里叶级数

本讲是第二部分的最后一讲,主要围绕马尔科夫矩阵和傅里叶级数,讲述了矩阵的对角化特征分解在其中发挥的作用。这两个案例只是做了浅显的介绍,重点是理解特征值与特征向量在其中扮演的角色以及其中千丝万缕的关联。

马尔科夫矩阵,傅里叶级数

马尔科夫矩阵

马尔科夫矩阵是一种描述概率相关的矩阵,它满足以下两条性质的矩阵:

  1. 每个元素均为非负数;
  2. 每列元素之和等于1;

形如: \[ A=\begin{bmatrix}0.1&0.01&0.3 \\ 0.2&0.99&0.3 \\ 0.7&0&0.4\end{bmatrix} \]

根据马尔科夫矩阵的性质,我们很容易得到两个推论:

  1. 马尔科夫矩阵必有一个特征值\(\lambda_1=1\)
  2. 除了特征值\(1\)以外,其他特征值的绝对值皆小于\(1\)

推论一是显而易见的,因为马尔科夫矩阵的每个列和都是1,因此,对于\(A-I\)来说,每个列和就都是0,此时显然\(A-I\)的行向量线性相关,即为奇异矩阵,行列式为0。

推论二的证明课上没有给出,我们暂用这一结论。

考虑此前差分方程的算式:\(u_k=A^ku_0=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+...+c_n\lambda_n^kx_n\),当\(A\)为马尔科夫矩阵时,由于\(\lambda_1=1,|\lambda_i|<1\),因此当\(k\)趋于\(\infty\)时,\(u_k\)趋于稳态:\(c_1x_1\)

马尔科夫矩阵的应用

课上用二阶马尔科夫矩阵模拟了两地人口迁移的模型: \[ \begin{bmatrix}U_{ka} \\ U_{ma}\end{bmatrix}_{t=k+1}=\begin{bmatrix}0.9&0.2 \\0.1&0.8\end{bmatrix}\begin{bmatrix}U_{ka} \\ U_{ma}\end{bmatrix}_{t=k} \]

马尔科夫矩阵\(A\)可以解释为:每隔一个时间周期,会有90%的人口留在加州,10%的人口迁移到麻省;与此同时,会有80%的人口留在麻省,20%的人口迁移到加州。

假设初始状态:\(U_{t=0}=\begin{bmatrix}0 \\ 1000\end{bmatrix}\)。对于这一模型,我们来分析一下稳态:计算求得马尔科夫矩阵的特征值为\(1\)\(0.7\),对应特征向量为:\(\begin{bmatrix}2 \\ 1\end{bmatrix},\begin{bmatrix}-1 \\ 1\end{bmatrix}\)

因此,通解为:\(U_t=c_1\begin{bmatrix}2 \\ 1\end{bmatrix}+c_2(0.7)^t\begin{bmatrix}-1 \\ 1\end{bmatrix}\)。当\(t\)趋于无穷时,第二项可以忽略,即最终稳态由第一项\(c_1\begin{bmatrix}2 \\ 1\end{bmatrix}\)决定。

我们可以带入\(U_0\)来求得\(c_1\)\(c_2\)分别为\(\frac{1000}{3}\)\(\frac{2000}{3}\),因此最终的稳态是:\(\begin{bmatrix}\frac{2000}{3} \\ \frac{1000}{3}\end{bmatrix}\)。即,经过无穷多次人口迁移后,加州的人口趋近于\(\frac{2000}{3}\),麻省的人口趋近于\(\frac{1000}{3}\)

傅里叶级数

\(n\)维空间一组标准正交基:\(q_1,q_2,...,q_n\),它们可以表示空间中的任意向量\(v\): \[ v=x_1q_1+x_2q_2+...+x_nq_n \]

\(Qx=v\)\(x=Q^{-1}v\)。由于正交矩阵\(Q^T=Q^{-1}\),故\(x=Q^Tv\)

对应到\(x\)的各个分量有:\(x_i=q_i^Tv\)

由此可见:用空间的一组标准正交基去点乘目标向量,就可以得到各个分量。

傅里叶级数就是在标准正交基的基础上构建的,我们可以对任意函数做傅里叶展开,得到表达式: \[ f(x)=a_0+a_1\cos x+b_1\sin x+a_2\cos 2x+b_2\sin 2x+... \]

傅里叶级数的展开最终是无限维,它的一组基是:\(1,\cos x,\sin x, \cos 2x, \sin 2x ...\)

傅里叶级数能够这样展开,恰恰源于这些基之间两两正交。

然而,此前我们对于向量的理解,首先它们是离散的,向量的内积可以写成:\(v^w=v_1w_1+...+v_nw_n\)。然而,傅里叶级数里的基却并非向量,而是一个连续的函数,那么对于连续的函数来说,内积是什么呢?

答案就是对二者的乘法进行积分。

此外,我们观察到,这些基函数都有周期为\(2\pi\)的特性,所以我们只需要对\([0,2\pi]\)区间进行积分即可: \[ \int_{0}^{2\pi}f(x)g(x)dx \]

我们任取一个\(g(x)\)比如\(\cos x\)来进行计算: \[ \int_{0}^{2\pi}(a_0+a_1\cos x+b_1\sin x+a_2\cos 2x+b_2\sin 2x)\cos xdx \\ =0+\int_{0}^{2\pi}a_1\cos^2xdx+0+...+0 \]

可以发现,除了原本在无限维空间中方向一致的\(\cos x\)以外,其他项的积分结果都是0,因此,\(\cos x\)和其他基向量正交。同理,也可以证的其他函数\(g(x)\)均有此性质。

另一方面,经过积分求解,还可以求得每一个系数\(a_i\)的表达式。例如:\(a_1=\frac{1}{\pi}\int_{0}^{2\pi}f(x)\cos xdx\)。同理可以求得其他系数。

所以从线性代数的角度来理解傅里叶级数,它本质上就是一种把函数展开到一组标准正交基上的手法。

附录

视频

参考链接


线性代数笔记(二十四)——马尔科夫矩阵,傅里叶级数
https://r00tk1ts.github.io/2023/10/13/线性代数笔记(二十四)——马尔科夫矩阵-傅里叶级数/
作者
r00tk1t
发布于
2023年10月13日
许可协议