![大数据数学基础](https://wfqqreader-1252317822.image.myqcloud.com/cover/474/43738474/b_43738474.jpg)
1.3.6 欧几里得空间与正交矩阵
在向量空间中,其基本运算就是加法和数乘,但在解析几何中的向量,还有长度、夹角等度量。本节主要介绍向量的一些度量性质。实际上,向量的一系列度量性质都可用向量的内积这一概念来表示。
定义1-33 设,
是
的两个向量,数
称为向量
与
的内积,记作
,即
。
定义了内积的向量空间称为欧几里得空间。向量空间
及其子空间都是关于内积的欧几里得空间。
由内积的定义,可得如下性质。
性质1-10 设都是n维向量,
是实数,则
(1)(对称性);
(2)(线性性);
(3)(非负性),且
当且仅当
。
解析几何中3维欧几里得空间中向量长度(或模)的概念,可直接推广到一般欧几里得空间中。
定义1-34 设是欧几里得空间
的任一向量,非负实数
的算术平方根
称为向量
的长度,记作
或
。
若,则称
为单位向量。
若,则
的长度为
。对任意非零向量
,因
,所以它的单位向量为
。
向量的长度具有如下性质。
性质1-11 设都是n维向量,
是实数,则
(1)长度(非负性),且
;
(2)(齐次性);
(3)(柯西不等式);
(4)(三角不等式)。
由以上关于向量内积及向量长度的性质,可以定义欧几里得空间中任意两个向量
的夹角
的余弦和距离
:
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1258.jpg?sign=1739297767-EW1PUUAt2kYlcv4VnSzkpT1zKSS1Je8k-0-92da8db5587dcd32fdd7d73dcf986bca)
(1.10)
如果欧几里得空间中两个非零向量
的内积为0,即
,则称
是正交的。
如上定义的夹角和距离也满足一些常见的几何性质,如三角不等式、勾股定理等。
定义1-35 若在不含零向量的向量组中,任意两个向量都正交,则称
是正交向量组。进一步地,如果正交向量组
中的每个向量都是单位向量,则称其为单位正交向量组。
如果正交向量组是向量空间
的基,则称
为
的正交基;如果单位正交向量组
是
的基,则称
为
的单位正交基,或称为标准正交基,也可以称为规范正交基。
显然,n维基本向量是
的标准正交基。
定理1-19 正交向量组一定线性无关。
在欧几里得空间中,通常用如下施密特(Schmidt)正交化方法计算标准正交基。
定理1-20 设:
是线性无关的向量组,则一定存在正交向量组
:
,使得
与
等价,进而一定存在单位正交向量组
:
,使得
与
等价。
在欧几里得空间中,如果
是
的基,则可以利用上述施密特正交化方法求得
的标准正交基。
例1-31 已知欧几里得空间的基
:
,
,
,利用施密特正交化方法,由基
构造
的标准正交基。
解:先正交化,令,
,
。
再单位化,令,
,
,则
即所求标准正交基。
定义1-36 对n阶方阵,若
,则称
为正交矩阵。
对正交矩阵,由
得
,因此
,即
可逆且
。又因为
,所以
也是正交矩阵。这就得到关于正交矩阵的如下几个简单性质。
性质1-12 设是n阶正交矩阵,则
(1)的行列式
或
;
(2)的转置就是
的逆矩阵,即
;
(3)也是n阶正交矩阵。
欧几里得空间中任意标准正交基
,
,
,
构成一矩阵
,由于
,因此有
,即
是正交矩阵。反之,若n阶方阵
是正交矩阵,即
,可知其列向量组是
的标准正交基,由此可得如下定理。
定理1-21 n阶方阵是正交矩阵,当且仅当
的n个列向量(或n个行向量)是
的标准正交基。
设,则有
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1342.jpg?sign=1739297767-Ekij7UtB5o1Wl1nQtgex7H5IMBupCSNY-0-d7844879f3172af6a0bf06359525eb71)
这就验证了例1-31中所求的基:
,
,
是标准正交基。
向量空间的任意向量可以表示为它的基的线性组合,而导数、微分、积分等计算都满足线性性质,因此可以考虑从特殊(基向量)到一般(空间的任意向量)的计算思路,如例1-32所示。
例1-32 求不定积分,其中
是常数,且
。
解:记,当分别取
时,计算可得
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1352.jpg?sign=1739297767-r0TWBoCR4MihYdAovRY3tdDZzBxsp2fY-0-13a2e4eea5c916db23d544ba4485e139)
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1353.jpg?sign=1739297767-4uUAkjdFBOMBLUQJcAzkeOe6z6QpTBWa-0-80e1e12d6731a3ddabf3a3451bbedc90)
因为,所以
是线性无关的,因此任意
,都可由
线性表出,即
,解之得
,由此得
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1360.jpg?sign=1739297767-v5XJZnpjWEl7BjXBfVwyuSEofe5nofLN-0-2e820464c607fdaa5816860a76ce7449)
其中,。
欧几里得空间中的向量有长度与夹角等度量概念,因此可以考虑一些几何应用。
例1-33 欧几里得空间中的勾股定理:设
且
与
正交,令
,则
,因为
。
例1-34 统计数据的相关度与相关矩阵 假设要计算一个班级学生的期末考试成绩和平时作业成绩的相关程度,我们考虑某大学一个教学班一学期两门数学课的作业成绩与考试成绩,表1-4所示的作业成绩、测验成绩、期末考试成绩都是两门数学课成绩之和,每门课满分为100分。
表1-4 一个教学班一学期两门数学课成绩
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1369.jpg?sign=1739297767-JbpRf4KvGJl7ZbXlRyXKpUQnjHGmtmyF-0-8b220f1ad4df7b5c2f43637188718d26)
将作业成绩、测验成绩、期末考试成绩各看作一集合,研究它们之间的相关关系。为了看出两个成绩集合的相关程度,并考虑不同成绩由于难度的不同形成了成绩高低的差异,将每类成绩的均值调整为0,各类成绩减去它相应的平均成绩后(也就是将表1-4中最后一行的平均成绩乘以后依次加到对应列的1~7行)用如下矩阵表示:
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1371.jpg?sign=1739297767-jAiyWSgy3ZFodw3IX3vXtwBgPc72ukIz-0-4a7048f6e73a855dbef4b81111ef0e0d)
的列向量
表示三个成绩集合中每个学生的成绩相对于均值的偏差,此三个列向量分量之和全为0,因此,为了比较两个成绩集合,将
中两个列向量
之间的夹角余弦
作为相关度,若余弦值接近
,说明此二向量接近于“平行”,因此这两个成绩高度相关;反之,若余弦值接近0,说明此二向量接近于“垂直”,因此这两个成绩是不相关的。例如,作业成绩和测验成绩的相关度为
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1378.jpg?sign=1739297767-04FTYviXBSQQf6Js4pBXwNPP98wfejj8-0-a1b1fd95958bd79e61c8e9b2cc7ebcf4)
(1.11)
相关度为1的两向量分量对应成比例,即这两个向量线性相关:
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1379.jpg?sign=1739297767-FmWBeiavY4hwVjoggqsy0mizeWxyE6tI-0-e5db7a1a5986e9ff74b0b29ee79f734d)
(1.12)
因此,把作业成绩用变量表示,测验成绩用变量
表示,相关度为1就意味着每名学生的作业成绩与测验成绩对应的数对位于直线
上。对于
,由式(1.12)得
,因此得
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1385.jpg?sign=1739297767-usDoXXlie9OXRePrKE5VULWJEBhNyADu-0-cbe36d73caa67491979243e43e269ec3)
(1.13)
综合上述,相关度由式(1.11)计算,拟合线性关系
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1386.jpg?sign=1739297767-xcnSic2t27KO4hyZKSx6aRXYwHixOBfm-0-041e1bccdd82babe0b39ed7dfd1595ed)
的系数由式(1.13)计算。
如果考虑单位向量,两个列向量
之间的夹角余弦为
,因此将矩阵
的3个列向量单位化后得如下矩阵:
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1392.jpg?sign=1739297767-u9uyE8qJkWZG2VgLLNppCxV3pN3FgDj5-0-8d23b54e1d37020f74baf201937c968c)
令,则
![](https://epubservercos.yuewen.com/BBC71D/23020656609778606/epubprivate/OEBPS/Images/txt001_1394.jpg?sign=1739297767-jeRPucCsIdNScKfOtvCp8YnOULfoiiV1-0-61f412ce238cd24b6e759a074aff96dc)
易知,中第
行第
列元素就是第
行与第
列的相关度,矩阵
称为相关矩阵。
由于其中相关度都是正的,所以该例子中的三个成绩是正相关的;负相关度表示两组数据的集合是负相关的;相关度为0表示两组数据的集合是不相关的。