如何理解矩阵转置和求逆的可交换性?

这是一个有趣的问题,但是要理解它不简单,甚至你会后悔干嘛要去理解什么几何。
由于过程很长,我帮你理一下思路:
矩阵(算子)对应于一个空间中的子空间(平面),取逆和取对偶(转置)变成一个空间上的简单变换。这两个变换是显然可交换的。

对了,矩阵的对偶是转置在复数域上的推广,一个矩阵的对偶是取转置后取复数共轭。一个实矩阵的对偶和转置是一样的。
要理解这个问题,需要了解什么叫Krein空间。我就不玩复杂的,尽量简单点。一个从\mathcal{H}:=\mathbb{C}^n映到自己的矩阵(线性映射)A可以看成是积空间\mathbb{C}^{2n}=\mathcal{H}\times\mathcal{H}=\mathcal{H}^2中的一个线形闭子空间(也有人管这个叫“图”),就是说我们定义
y=Ax\Longleftrightarrow (x,y)^{T}\in A,
(右边的A不再是一个矩阵了,而是一个空间)。其实不难理解,一个矩阵可以看成是一个它的图像,也就是说一个平面,放过来,一个(足够好的)平面唯一的确定一个矩阵。

于是我们可以把它的逆也看成一个子空间A^{-1}:=\{(y,x)^T\in \mathcal{H}^2; (x,y)^T\in A\}
可以简单的证明,这个空间对应的矩阵刚好是矩阵的逆矩阵。

我们可以引入一个向量逆运算:对于 一个向量\hat{f}=\begin{pmatrix}f\\ f, 定义它的逆\hat{f}^{-1}:=\begin{pmatrix}f. 于是\hat{f}\in A当且仅当\hat{f}^{-1}\in A^{-1}.

对于空间\mathcal{H}^2,我们引入下面的Krein内积。


这里:(f,g)_{\mathcal{H}}=f\cdot \overline{g}.
于是,矩阵的对偶矩阵可以看成是这个空间在krein内积下的正交空间。


(想一想为什么?),有了这些几何理解后,下面的结果就是简单。


我有时间再解释吧,这种思维可以推广到更一般的情况。这种把算子看成空间的思维是现在泛函分析的一般方法了,没什么好奇怪的

来源:知乎 www.zhihu.com

作者:dhchen

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 7 个回答,查看全部。

延伸阅读:

在进行线性回归时,为什么最小二乘法是最优方法?

如何用简单易懂的例子解释隐马尔可夫模型?从更几何一点的角度来说,有限维线性空间里的泛函可以看作是一维的线性映射,所以它有n-1维的核空间,也就是这个空间里的向量经过泛函作用之后得到了0。如果我们在这个线性空间上按照欧式几何规定内积

<\alpha, \beta> = \beta^T\alpha = \alpha^T\beta

泛函的特征向量实际上就是这个核空间的正交补,或者用更几何的说法,它的特征向量就是这个n-1维超平面的法向量。注意同一个超平面的法向量可以有不同的方向(正负)以及长度,它们对应了线性相关的一组泛函。

考虑一个n维到n维的线性映射A,它将一个n-1维超平面映射到了另一个超平面,这个新的超平面也有对应的法向量,一般来说它并不是原来的法向量经过A映射得到的结果,因为一般的线性映射并不会保证内积的不变性。那么新的法向量和原来的法向量究竟是什么关系呢?

实质上就是要找到一个映射B,使得:

<A\alpha, B\beta> = <\alpha, \beta>

对于内积来说,有

<A\alpha, \beta> = <\alpha, A^T\beta>

因此显然有

B = (A^T)^{-1}

可见A与 (A^T)^{-1} 是一对保证内积不变的线性映射,将它们分别作用于两个向量,可以使得两个向量的内积保持不变。

但是内积是对称的,那么如果我反过来,将 (A^T)^{-1} 作用到n-1维平面上,那法向量的线性映射就是A了,这说明取转置再取逆这个操作,重复执行两次,能得到原始的线性映射!于是我们就得到

(((A^T)^{-1})^T)^{-1} = A

也就是

(A^T)^{-1} = (A^{-1})^T

这是从保持内积不变的角度来讨论。从这里也可以看出,保内积的两个映射永远是一对,如果去掉取逆的过程,就是之前的对偶的概念了。

来源:知乎 www.zhihu.com

作者:灵剑

【知乎日报】千万用户的选择,做朋友圈里的新鲜事分享大牛。
点击下载

此问题还有 7 个回答,查看全部。

延伸阅读:

在进行线性回归时,为什么最小二乘法是最优方法?

如何用简单易懂的例子解释隐马尔可夫模型?