The nature of linear algebra: vector papers

Benpian notes, as a "logical station" Logic and AI] content section in machine learning sector.

A vector

If the "linear algebra" likened to a building, then the "vector" is this a masonry building. "Vector" is a starting point and foundation for all other learning content of linear algebra.

Before beginning, let's you and I are aligned on the "vector is what" answer to this question. From the broadest sense, can be understood from three perspectives of "vector":

Physical point of view

Computer programming perspective

Mathematically

From the point of view of physics, the so-called "vector" is a direction and magnitude of the amount has usually indicated by arrows on the plane. A plane vector may appear anywhere, as long as the same magnitude and direction, is equal to the vector. In addition to two-dimensional vector, as well as three-dimensional vector space.

From the perspective of computer programming, an ordered vector of numbers only, it can be represented by the digital column column (column):

For example, I can use a digital description of the house I want to buy the future, which I am most concerned about is the price and size of the area of ​​the house, so I could use two digits to express the future I want to buy a house concern points:

Area: 100m²

Price: ¥ 800,000

Conversion concern these two points as vectors is:

It is worth noting that the two numbers vector position is very important, for example, the first row of numbers represents the area, second line indicates the price, if there is no order limit, you can not compare the two vectors. therefore,

In the programmer view, the so-called "vector" is nothing more than a list structure, whose members are digital. The number of members of the list reflects the number of dimensions. For example, a two-dimensional vector is the vector embodiment.

While standing mathematical point of view, it is the combination of these two perspectives, seen as arbitrary vector with two other vectors and coefficients.

 

Any vector can be seen as two other vectors with coefficients "and"

Why single vector to be seen with the other two vectors and coefficients? Because this is the key to our understanding of the essence of vector and linear algebra. Therefore, a deep understanding of vector, scalar and vector addition of vectors start from the first multiplication.

However, before discussing these two vector operations, linear algebra is a look at how to describe vector. First, there is a geometric vector "image" - arrows.

Vector geometry "image" is the arrow, algebra "image" is a column of numbers with square brackets

Linear algebra, geometry representation are all vectors in Cartesian coordinates, the tail of the arrow is always located at the origin of the coordinate system.

线性代数是用直角坐标系表示向量的几何特征,而箭头的位置总是位于原点

这一点和物理学不同,因为物理学中的向量可以分布在任何位置。把向量的几何形象箭头放入直角坐标系,我们就可以得到许多关于向量的新的概念。首先,我们可以把几何表示转换成一列数字,而这些数字和其几何表示的对应关系,对于理解线性代数的核心概念非常重要。在这个语境下,我们关注的目标有三个:

1. 向量的几何表示:一个从原点出发到达坐标系中任意确定的一点做一线段,线的头部冠以箭头;

2. 向量的代数表示:一列数字,表示箭头所处的在坐标系中的位置——坐标点(cooridinate),数字的数量,由坐标系的维度决定;

3. 直角坐标系,这是任何有中学数学基础的人都熟悉的东西,不过在这里,我们将以新的视角重新理解坐标系的概念。首先,我们关注的是平面二维直角坐标系。

一个直角坐标系,是由两条相互垂直的直线构成,分别称作x-轴和y-轴,两线的交叉点称作原点。在这个坐标系上的所有向量的几何形象都始于原点。有了两条水平和垂直的数轴之后,我们可以选择【任意】长度作为单位,在坐标系统中表示1。这句话非常重要,坐标系统中作为单位长的1,其实际长度是任意的,也就是说,现在我们可以选择长度为7mm的距离作为单位长,未来为了某种需要我们可能改变这个单位的实际长度,例如14mm。现在需要想象的是,同一坐标系上的一个向量,如果坐标系的单位长度改变,甚至坐标系的角度改变,是否影响向量的表示。

平面直角坐标系的单位长度是任意的,不管长度如何我们始终认为它代表1

如果要用这个直角坐标系描述整个二维空间,那么这个刻度就不再仅仅限于坐标纵横数轴本身,而是整个二维空间。

有了这个网格,我们就可以描述在这个空间中的任何局部——子空间

什么时候我们需要这样的网格空间?答案是当我们需要考虑在这个空间中所有向量时。如果我们的关注点只是少数几个向量时,我们仍然采用原来的坐标系表示法。

现在我们回到「向量」的话题。向量在坐标上的代数表示,是一对数字,称作「坐标点」,它的作用是确定从原点出发的向量如何得到它在坐标系上的顶点:

其中,[-2, 3]所代表的意义是:

-2:表示这个向量沿着x-轴向左移动了2个单位,

3:表示这个向量沿着y-轴向上移动了3个单位,

这里有两个重点,一、移动:所有向量都可以看做是点从原点位置出发移动所产生的;二、移动方式,先不要把这个移动看做是从原点到顶点坐标的直接移动,而是分两步进行:先水平移动,后垂直移动,或反之。为什么,这一点非常重要,当后面讨论向量运算时就会明白。现在所要理解的就是,二维向量是由两个「普通」的数合成的。

我们有时需要区分向量和点的概念。在表示方面,向量是纵列的两个数,而点则是我们通常熟悉的方法:(-4, 2)。

向量有一个重要性质:每对数字只能表示一个平面向量;而一个平面向量只能对应于唯一一组数字。在三维坐标系中,

三维向量用一纵列三个数表示,同样,一纵列数字与向量是一对一的关系

下面,我们开始讨论向量的基本性质之一:向量的加法和向量的标量乘法。这两种运算,是最重要的「线性运算」。首先,我们来看向量的加法运算:当二维空间存在两个以上的向量时,我们将用网格形式表示:

图中,我们有两个向量:v 和 w,从几何的角度,两个向量的加法,就是把w移到v的顶端,两个向量首尾相连,这样,两个向量的和就是从原点到移动后w的顶点。从直观上来看,从原点到w的顶点,有两条通路:从原点经v 和 w,到达终点,另一条则是抄近道:从原点直接到终点。这个「抄近道」得到的新向量就是v + w的和。

向量加法:将v或w任意一个向量移向另一个向量的顶端首尾相接,然后做从原点掉移动后向量的顶点

如何理解向量的加法运算?正如前面所说,向量的形成是通过点的移动形成。如果从整个坐标空间考虑,向量v的形成,所代表是在坐标空间中「一类」点的移动。

向量v所代表的是在空间内所有点都可以有(大小方向)相同的自自左下向右上的运动

 

向量w所代表的是在空间内所有点都可以有(大小方向)相同的自左上向右下的运动

如果你仍然从概念上不太理解为什么向量加法的实质是两箭头首位相接,那么请看下面的x-轴上的加法。

2+5 是由向量[2,0]和向量[5,0]构成,两个向量首尾相接,后面向量的值正好是[7,0]。与之相对,我们可以从原点直接到[7,0]。从这个例子可以看出,我们在小学学习的加法,实际上是向量加法的特例,是没有其它维度量参与的加法运算;第二、向量加法实际上是量和方向的叠加。

如果从代数角度分析,那么这两个向量所代表的坐标值分别为

其结果为:

除了向量加法,另一个重要运算就是标量乘法。在讨论标量乘法之间,让我们先了解一下「标量」(scalar)是什么概念。scalar这个词的原形是scale,基本意思是:体量规模的大小伸缩。scalable,是指一件事物可大可小、适应能力强。scalar的意思是,能让某个向量的体量改变的量。这一点可以从我们小学的乘法运算看出基本意思。鸡蛋3块钱一斤,买了5斤,一共是15块钱。其中,3的单位是钱,而5的单位是重量。3块 x 5斤,所表示的,3这个量被5放大,所以得到的值是放大了5倍的货币的值。因此我们可以把3块看做是一个一维向量,把5斤看做是帮助这个量放大体量的量,亦即,5个3块钱。如果向量不是一维而是二维,例如向量v,[3,1],如果体量翻番,则是 [3,1] x 2 = [6, 2]。

因此,所谓「标量」,其意义就是使向量可以伸缩的量,其类型就是上面提到了「普通」的实数。下面表示的就是向量v = [3,1]在平面坐标系的几何表示:

做标量运算:v * 2 = 2 v = [6, 2]

[3,1] * 2的几何表示

如果标量大于0小于1,这个标量令向量的体量变小。

标量除了可以改变向量的大小,还可以改变向量的方向,

标量的作用是:通过值改变向量的体量,通过正负号改变向量的方向;如果只改变体量而不考虑方向的改变,亦即,标量的绝对值,那么标量对向量的作用称做scaling,大致可以译作「体量伸缩」。

因此标量的真正含义是:伸缩量,它的类型是任何实数、有理数或整数。

有了向量加法和标量乘法的概念,我们就可用这两个运算定义任意向量。下面再仔细看一下向量v

我们可以把这个向量看做是两个向量经过向量加法和标量乘法运算的结果:

首先设有一个沿x-轴的一维向量i = [1,0],这个向量通过标量乘法向右延伸3个单位:i * 3 = 3i:代数表示:3 · [1,0] = [3, 0]

同样,设有一个沿y-轴的一维向量j = [0,1],这个向量通过标量乘法向上保持是一个单位:j * 1 = 1j,代数表示:1 · [0,1] = [1, 0]

两个向量相加:3i + 1j = [3,0] + [0,1] = [3,1]

这正好是v的向量值。这个事实告诉我们,向量v可以由i和j定义,而v的向量值[3, 1]可分别看做是i和j的标量。因此,i和j是构成任何向量的基本要素。这里,我们暂且把i和j称作【单位向量】。总之,向量v,是单位向量i和j,与向量值[3,1]中的两个标量3, 1经过标量乘法和向量加法运算的结果。

推而广之:任何向量 v = [m, n],都可以看做是单位向量i = [1,0]和j=[0,1]经过标量乘法和向量加法运算得到的结果:mi +nj = v。这两个单位向量i和j,标准术语是:【基向量】(basis vector)。

小结:

向量的三个视点:

物理视点:带有方向和大小的量;

计算机编程视点:有序的实数序列,通常用方括号的纵列表示。

数学视点:物理视点与编程视点的结合,一个向量在直角坐标系中既有几何解释也有代数表示。

向量,代表了我们对某个对象的量化关注点,例如一开始的例子:未来的房子。这些量化的关注点在现实世界中可以有成千上万:

这些关注点可以化作几何形态的坐标向量:

关注点,在现实生活中称作数据,在机器学习的语境中称作「特征」(feature)。通过向量的研究,我们可以发现数据的模式,找到需要的信息。

在整个在平面直角坐标系中所形成的网格系统,可以看做是一个二维空间,每一个「格」可以看作是这个空间的基本单位,代表了i+j——基向量,因此所有这些基本单位的集合,称作「向量空间」。

下一篇的话题是:线性组合、span,基向量

Guess you like

Origin www.cnblogs.com/liuys635/p/12069464.html
Recommended