自学内容网 自学内容网

线性代数的本质

03-矩阵与线性变换

线性变换中的“变换”本质上就是“函数”的一种花哨说法,它接受内容并输出对应结果,在线性代数的情况下,考虑的是接受一个变量并且输出一个变量的变换。使用“变换”是在以特定方式来可视化这一输入_输出关系。理解向量函数的方法是使用运动。

线性代数只限制在一种特殊类型的变换上,这种变换更容易理解,称为“线性变换”,如果一个变换具有以下两条性质,我们就称它是线性的,一是直线在变换后仍然保持为直线,不能有所弯曲,二是原点必须固定。总的来说 应该把线性变换看作是“保持网络线平行且等距分布”的变换

如何用数值描述线性变换?

你只需要记录两个基向量i帽和j帽变换后的位置,其他向量都会随之而动。一个二维线性变换仅由四个数字完全确定。2*2矩阵可以把它的列理解为两个特殊的向量,既变换后的i帽和j帽,想了解线性变换对这个向量的作用,只需要取出向量的坐标,将它们分别与矩阵的特定列相乘,然后将结果相加即可,这与“缩放基向量再相加”的思想一致。

如果想算出任何向量在逆时针旋转90度后的位置,只需要把它与矩阵相乘即可。还有一个有趣的变换,叫做“剪切”。

线性变换是操纵空间的一种手段,它保持网格线平行且等距分布,并且保持原点不动。

04-矩阵乘法与线性变换复合的联系

基向量就是i帽和j帽,这是因为其他任意向量都能表示为基向量的线性组合。

一个变换结束进行另一个变换,比如 首先旋转然后剪切,从头到尾是另一个线性变换,它与旋转剪切完全不同,这个新的线性变换通常被称为前两个独立变换的“复合变换”。和其他线性变换一样,也可以用矩阵完全描述这个复合变换。一个麻烦的方法是 先将它左×旋转矩阵 然后将得到的结果在左×剪切矩阵,从数值角度看,这意味着对一个给定向量进行旋转然后剪切,无论所选向量是什么,结果都应该与复合变换作用结果完全相同,因为新矩阵应当捕捉到了旋转然后剪切的相同总体效应。两个矩阵相乘有这着几何意义,也就是两个线性变换相继作用。

乘积需要从右向左读,首先应用右侧矩阵所描述的变换,然后再应用左侧矩阵所描述的变换,它起源于函数的记号,所以每次将两个函数复合时,总是要从右向左读。

矩阵乘积顺序对于结果是有影响的。

05-行列式

测量一个给定区域面积增大或减小的比例

只要知道单位正方形面积变化的比例,它就能告诉你其他任意区域的面积变化比例,首先注意一点,无论一个方格如何变化,对其他大小的方格来说,都会有相同的变化,这是由“网络线保持平行且等距分布”这一事实推断得出的,对于不是方格的形状,它们可以用许多方格良好近似,只要使用方格足够小,近似就能足够好,由于所有小方格都进行了一个比例的缩放,所以整个形状也进行了同样比例的缩放。这个特殊的缩放比例,即线性变换改变面积的比例,被称为是这个变换的行列式。只要检验一个矩阵的行列式是否为0,我们就能了解这个矩阵所代表的变换是否将空间压缩到更小的纬度上。

将一个区域缩放负数倍是什么意思?

这和定向的概念有关。这个变换在感觉上将整个平面反转了,我们称类似的变换改变了空间的定向,在i帽和j帽中去考虑,初始状态下是j在i的左侧,变换后j在i的右边,那么空间定向就发生了改变,当空间定向发生改变时,行列式为负,但行列式的绝对值依然表示区域面积的缩放比例。

负的面积缩放比例为什么会自然地用来描述定向改变呢?

考虑i帽接近j帽进行的一系列变换,当i帽靠近j帽时,空间也被压缩的更严重,这意味着行列式趋近于0,当i帽与j帽完全重合时,行列式为0。如果i帽继续沿着这个方向移动,行列式继续减小为负值不是一件很自然事吗?

行列式在三维空间中的意义

给定区域体积增大或减小的比例。变换后会得到平行六面体,初始体积为1,而行列式给出的是体积缩放比例,所以可以把行列式简单看作这个平行六面体的体积。行列式为0则意味着整个空间被压缩为零体积的东西,也就是一个平面或一条直线,或者更极端的情况下,一个点。

负值行列式在三维下的含义

有一种方法来描述三维空间的定向,那就是“右手定则”,右手食指指向i帽的方向,中指指向j帽的方向,当把大拇指竖起来时正好是k帽的方向,如果在变换后你仍然可以这么做,那么定向没有改变,行列式为正,如果否则 如果在变换后你可能用左手这么做,说明定向发生了改变,行列式为负。

 

06-逆矩阵,列空间,秩与零空间

线性代数的有用之处,能用来描述对空间的操纵,能帮助我们求解特定的方程组,在每个方程中,所有的未知量只具有常系数,这些未知量之间只进行加和,没有幂次,没有奇怪的函数,没有未知量间的乘积等等。将未知量放在方程左边,剩余的常数项放在等号右边,并且将同一个未知量竖直对齐,要做到这一点,你可能需要在某个未知量不出现时添加0这个系数,这就被称为“线性方程组”。这和矩阵向量乘法非常相似,实际上,你可以讲所有的方程合并为一个向量方程。这个方程有一个包含所以常数系数的矩阵。

下述x和v均为向量

求解Ax=v意味着我们去寻找一个向量x,使得它在变换后与v重合,只考虑对空间变形以及变换前后向量的重叠,就将多个未知量相互混合的复杂方程组印入脑中,假设你有两个方程和两个未知量构成的方程组,意味着A是一个2×2的矩阵,v和x都是二维向量,现在这个方程的解依赖于矩阵A代表的变换,是将空间挤压到一条线或一个点等低维空间,还是保持像初始状态的完整二维空间。分为两种情况来探讨,A的行列式为零和A的行列式不为零。先看A的行列式不为零,此时空间并未被挤压为零面积的区域,在这种情况下,有且仅有一个向量(在变换后)与v重合,并且可以通过逆向变换来找到这个向量,如同倒带一样,通过跟踪v的动向,你就能找到满足Ax=v的向量x,当你逆向进行变换时,它实际上对应了另一个线性变换,被称为“A的逆”,记为A^(-1),A的变换和A逆的变换会回到原始状态,两个变换相继作用在代数上体现为矩阵乘法,所以A逆的核心性质在于A逆×A等于一个“什么都不做”的矩阵,被称为“恒等变换”。它保持i帽和j帽不变,所以它的列就是(1,0)和(0,1),一旦你找到A的逆,你就能在两边同乘A的逆矩阵来求解向量方程,这个过程在几何上,就对应于逆向进行变换并跟踪v的动向,对于两个未知量和两个方程构成的方程组,几乎可以确定它存在唯一解。只要变换A不将空间压缩到一个更低的纬度上,也就是它的行列式不为零,拿它就存在逆变换-A逆,要想求解方程,只需要将A逆与向量v相乘即可。当行列式为零时,与这个方程组相关的变换将空间压缩到更低的维度上,此时没有逆变换,你不能将一条线“解压缩”为一个平面,这样就要求将一个单独的向量变换为一整条的向量,但是函数只能将一个输入变换为一个输出。

类似的对于一个三维方程或三维空间量,如果变换将三维空间压缩为一个平面,甚至是一条直线或一个点,那么它也没有逆变换,它们都对应行列式为零的情况,因为此时所有区域都被压缩到零体积,即便不存在逆变换,解仍然可能存在。

当变换的结果为一条直线时,也就是说结果是一维的我们称这个变换的秩为1,如果变换后的向量落在某个二维平面上,我们称这个变换的秩为2,所以说“秩”代表变换后空间的维数,比如2×2的矩阵,它的秩最大为2,意味着基向量仍旧能张成整个二维空间。不管是一条直线,一个平面还是三维空间等,所有可能的变换结果的集合都被称为矩阵的“列空间”。矩阵的列告诉你基向量变换后的位置,这些变换后的基向量张成的空间就是所有可能的变换结果,同样也会有一整条线的向量变换后落在原点,如果三维线性变换将空间压缩到一个平面上,同时也会有一整条线上的向量在变换后落在原点。如果一个三维线性变换将空间压缩到一条直线上,那么就有一整个平面上的向量在变换后落在原点,变换后落在原点的向量的集合,被称为矩阵的“零空间”或“核”,变换后一些向量落在零向量上,而“零空间”正是这些向量所构成的空间,对线性方程组来说,当向量v恰好为零向量时,零空间给出的就是这个向量方程所有可能的解。

06-附注(不同维度空间之间的线性变换)

一个二维向量到三维向量的变换,同之前一样,如果网格线保持平行且等距分布,并且原点映射为自身,就称它是线性的。输入的二维向量与输出的三维向量是完全不同的“物种”,当你看到一个3×2得矩阵时,它的几何意义是将二维空间映射到三维空间上,因为矩阵有两列表明输入空间有两个基向量,有三行表明每个基向量在变换后都用三个独立的坐标来描述。

一个二维空间到一维空间的变换,一维空间是一个数轴,这样的变换接受二维向量,然后产生一个数,形象理解线性性质的含义就是说,如果在一条直线上有一系列等距分布的点,在映射到数轴之后,它们将保持等距分布。

07-点积与对偶性

如果有两个维度相同的向量或者两个长度相同的数组,求它们的点积,就是将相应坐标配对,求每一对坐标的乘积,然后将结果相加。利用投影理解几何意义,当两个点积的指向大致相同时,它们的方向相同,即为正,当它们互相垂直时,意味着一个向量在另一个向量上的投影为零向量,而它们的指向基本相反时,它们的点积为负。

为什么点积与顺序无关?

如果v和w的长度相同,可以利用其中的对称性,因为w向v上投影,并将w的投影长度与v的长度相乘和v向w上投影,并将v的投影长度与w的长度相乘互为镜像,缩放向量对点积的结果是相同的。

为什么点积与投影有关?

对偶性,两种事物之间自然而又出乎意料的对应关系,多维空间到一维空间的线性变换,有不少函数能够接收二维向量并输出一个数,线性变换要求更严格。如果有一系列等距分布于一条直线上的点,然后应用变换,线性变换会保持这些点等距分布在输出空间中,也就是数轴上,否则,如果这些点没有等距分布,那么这个变换就不是线性的。可以说一个向量的对偶是由它定义的线性变换,一个多维空间到一维空间的线性变换的对偶是多维空间中的某个特定向量。

08(1)-叉积的标准介绍

v和w均为向量

v×w=平行四边形面积,如果v在w右侧,那么v叉乘w为正,并且值=平行四边形面积,如果相反,那么v叉乘w为负,即平行四边形面积的相反数。顺序会对叉积有影响,i帽叉乘j帽结果为正,实际上,基向量的顺序就是定向的基础,因为i帽在j帽的右侧,所以记得v在w的右侧时,v叉乘w为正。

行列式就是变换前后面积变化比例的度量,而我们关注的就是以i帽和j帽为边的正方形,变换之后 这个单位正方形变成我们关心的平行四边形。

真正的叉积是通过两个三维向量生成一个新的三维向量。比如这两个向量围成的平行四边形面积是2.5,叉积的结果不是一个数而是一个向量,而这个向量的方向与平行四边形(所在的面)垂直,使用右手定则,右手食指指向v的方向,中指指向w的方向,当你把大拇指竖起来时所指的方向就是叉积方向。

基向量作为矩阵元,使用对偶性的思想

08(2)-以线性变换的眼光看叉积

基向量作为矩阵元 最终的得到的也是一个向量,性质如下,它的长度等于v和w所确定的平行四边形的面积,他的方向同时与v和w垂直,并且满足右手定则。对偶性的思想在于,每当你看到一个(多维)空间到数轴的线性变换时,都与空间中的唯一一个向量对应,也就是说,应用线性变换和这个向量点乘等价。数值上说 这是因为这类线性变换可以用一个只有一行的矩阵描述,而它的每一列给出了变换后基向量的位置,将这个矩阵与某个向量v相乘,在计算上与将矩阵转置得到的向量和v点乘相同,每当看到一个从空间到数轴的线性变换,都能找到一个向量 称为这个变换的对偶向量,使得应用线性变换与对偶向量点乘等价。

定义一个从三维空间到数轴的特定线性变换,并且它是根据向量v和w来定义的,当我们将这个变换与三维空间中的对偶向量关联时,这个对偶向量就会是v和w的叉积。真正的三维向量的叉积接收两个向量并输出一个向量,他并不是接收三个向量并输出一个数。

这个函数得一个至关重要的性质在于它是线性的,引入对偶思想,可以通过矩阵乘法来描述这个函数,因为这个函数从三维空间到一维空间,就会存在一个1×3的矩阵来代表这个变换,而对偶性的整体思路是,从多维空间到一维空间的变换的特别之处在于可以将这个矩阵立起来,并且将整个变换看作与这个特定向量的点积。

当你将向量p和某个向量(x,y,z)点乘时,所得结果等于一个由(x,y,z)和v与w确定的平行六面体的有向面积,什么样的向量p才能满足这一特殊性质?向量p与其他向量的点积的几何解释是将其他向量投影到p上,然后将投影长度与p的长度相乘,对于平行六面体的体积,首先获得由v和w确定的平行四边形的面积×向量(x,y,z)在垂直于平行四边形方向上的分量(不是(x,y,z)的长度),换句话说,我们找到的线性函数对于给定向量的作用是将这个向量投影到垂直于v和w的直线上然后将投影长度与v和w张成的平行四边形面积相乘,但是,这和垂直于v和w且长度为平行四边形面积的向量与(x,y,z)点乘是一样的,判断方向应用右手定则。

09-基变换

i帽和j帽被称为坐标系中的基向量。

如何在不同坐标系中进行转化?

用某个向量的特定坐标与任意的基向量数乘,然后将结果相加,这是矩阵向量的乘法。

一个变换的逆是一个新的变换,它将所选的变换逆向进行。

10-特征向量与特征值

首先,考虑二维空间中的某个线性变换,比如,将基向量i帽变换到坐标(3,0),j帽变换到坐标(1,2),关注它对特定向量的作用,并且考虑这个向量张成的空间,也就是通过原点和向量尖端的直线,大部分向量在变换中都离开了其张成空间,如果向量正好落在这条直线上,感觉更像是巧合,不过某些特殊的向量的确留在它们张成的空间里,意味着矩阵对它的作用仅仅是拉伸或者压缩而已,如同一个标量。在这个例子中,基向量i帽就是这样一个特殊向量,i帽张成的空间是x轴,而且从矩阵的第一列可看出,i帽变成了原来的3倍,仍然留在x轴上,因为线性变换的性质,x轴上的任何其他向量都只是被拉伸为原来的3倍,因此也就留在了它们张成的空间里,线性性质暗示着一点,处在它所张成的对角线上的其他任何一个向量,也仅仅被拉伸为原来的2倍。对这个变换而言,以上就是所有拥有这一特殊性质(留在它们张成的空间里)的向量这些特殊向量被称为“特征向量”,每个特征向量都有一个所属的值,被称为“特征值”。即衡量特征向量在变换中拉伸或压缩比例的因子。如可以有一个特征值为-1/2的特征值,意味着这个向量被反向,并且被压缩为原来的1/2,但重点在于,它停留在它张成的直线上,并未发生旋转。

三维空间中的旋转

如果找到特征向量,那么找到的就是旋转轴,在这种情况下,相应的特征值必须为1,因为旋转并不缩放任何一个向量,所以向量的长度保持不变。对于任一矩阵描述的线性变换,你可以通过将矩阵的列看中变换后的基向量来理解它,但是,理解线性变换作用的关键往往较少依赖于你的特定坐标系,更好地方法是求出它的特征向量和特征值。当且仅当矩阵代表的变换将空间压缩到更低的维度时,才会存在一个非零向量,使得矩阵和它的乘积为零向量,空间压缩对应的就是这个矩阵的行列式为零。

二维线性变换不一定有特征向量

剪切变换,将i帽保持不变。将j帽向右移动一个单位,得到(1,0)和(1,1),所有x轴上的向量都是属于特征1的特征向量,因为它们都保持不变,实际上,这些就是所有的特征向量。可能会出现只有一个特征值,但是特征向量不止在一条直线上的情况

特征基

如果基向量恰好是特征向量,比如,可能i帽变为原来的(-1)倍,j帽变为原来的2倍,将它们的新坐标作为矩阵的列,注意,它们的倍数-1和2,也就是i帽和j帽所属的特征值。位于矩阵的对角线上,而其他元素均为0。除了对角元以外的其他元素均为0的矩阵被称为对角矩阵,所有基向量都是特征向量,矩阵的对角元是它们所属的特征值.

对角矩阵在很多方面都更容易处理,其中一个重要的方面是,矩阵与自己多次相乘的结果更容易计算,因为对角矩阵仅仅让基向量与某个特征值相乘 用作新基的向量坐标有特征向量,新矩阵必然是对角的,并且对角元对应特征值。这是因为,它所处的坐标系的基向量在变换中只进行了缩放,一组基向量(同样是特征向量)构成的集合被称为一组“特征基”

11-抽象向量空间

向量是什么?

比如说一个二维向量,描述为一个箭头,一个实数对。行列式和特征向量与所选坐标系无关,行列式得到的是一个变换对面积的缩放比例,特征向量则是在变换中留在它所张成的空间中的向量,这两者都是暗含于空间中的性质,这并不会改变它们最根本的值,但是如果向量根本上并不是一组实数构成的,它们的本质更具空间性。从某种意义上说,函数实际上只是另一种向量,类比两个向量的加法,可以将两个函数f和g相加,从而获得一个新函数(f+g),这种做法是合理的。类似的 函数与一个实数相乘也有合理的解释,只是把输出的值与那个数相乘。

“一个函数变换是线性的”是什么意思?

线性的严格定义是相对抽象而符号繁重的,但是,抽象性带来的好处是我们能得到一般性的结论,它不仅适用于箭头,也适用于函数,满足以下两个性质的函数是线性的,这两条性质通常被称为“可加性”和“成比例”,可加性意味着如果你把两个向量v和w相加,然后对它们的和应用变换,得到的结果和将变换后的v与变换后的w相加一致,成比例是说,将一个向量v与某个数相乘,然后应用变换,得到的结果和变换后v与这个数相乘一致。线性变换保持向量加法运算和数乘运算,一盒线性变换可以通过它对基向量的作用来完全描述,这使得矩阵向量乘法成为可能,因为任一向量都能表达为基向量以某种方式进行线性组合,所以求一个向量变换后的结果,实际上就是求出变换后的基向量以相同方式进行线性组合的结果。

用矩阵描述求导

首先,给这个空间赋予坐标的含义,这需要选取一个基因为多项式已经是数乘x的不同次幂再做加和的形式,所以我们就把x的不同次幂作为基函数,换句话说,第一个基函数就是一个常函数,基函数在此起到的作用和i帽j帽k帽在向量的世界中起到的作用类似,因为多项式的次数可以任意高,所以这个基函数集也是无穷大的。总的来说,每一个多项式都只有有限项,所以它的坐标就是有限的数加上无限的0。

1159eddbf30c46a6968f2771d045ef39.jpg

0e593d293c1b42a4ad6ef03c9ebc8356.jpg 

8d687a516ae042f38514178c086d2800.png 

9655c8477bd047abb7b797e9187ecf8d.jpg 

48482549917e438f8db34f3f71750ba8.jpg 

3693858a285d46f7b54f25ec89d8dce7.jpg 

c6a834961e904b7c9d13b77f6dbd1287.jpg 

19dc85b5d63c4b3484936b91c1afc2a3.jpg 

3173784b849e4b4b82cdee7ce6f7f5f7.jpg 

 

 

 


原文地址:https://blog.csdn.net/yn3535_/article/details/142885139

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!