0%

线性代数的本质(笔记00)概括


视频来自于B站.大学课堂重点是讲解怎么计算,矩阵推出的定理.这个视频着重点是矩阵究竟意味着什么. 有能力把一个复杂的东西抓住核心讲解出来的,这是我及其敬佩的能力之一.这篇文章我把认为是核心的点摘录下来.这文章断断续续写了半个月,发现篇幅太长,于是又拆分了

big bang 中Sheldony 眼中的工程师 Howard 是这样:

工程师首先要具备的是实现工程能力.虽然我们的工程是作用在看不见的二进制世界里,但它确是实实在在地在影响这我们这个物质世界. 工程能力我还在修炼的道路,但我能看到,随着前方的深入,我强化的会是我的抽象能力.不断的抽象出来, 在代码和代码发生作用的世界不断转换, 抽象的一种尽头可能就是数学.这是我的一种看法.

视频提到的书籍和工具

Linear Algebra Done Right

作者使用的工具包:manim

B站视频资源

学习总结

我觉得整个线性代数其实是在研究下面几个问题

假设在一个静止的空间,向量会是怎么样子的

向量是啥? 这里有两种学科的视角:

  • 物理学生: 空间中特定方向特定长度的箭头

  • 计算机学生: 有序的数字列表

区别在于:

在物理学生眼里, 箭头可以坐落在空间任意一个位置. 对于计算机学生的视角, 有序的数字列表意味着我们默认了一个原点作为列表的起点.

为什么这会造成区别?

我们可以想象我们是漂浮在外太空的行星,当你不关心(或者不确定)空间的起始位置时,你只能通过相对位置来理解你周围的事物.所以为了方便描述, 我们人为地假定了原点基向量 的存在.从原点出发,我们会得到一个行进的方向,运动需要一个单位. 这是向量的一种理解方式.

对于向量的两种基本运算:

  1. 叠加性

  2. 乘法(伸缩).

向量的运算基本就是围绕着这两个基本运算来的.

我上面唠叨了那么多,做研究的不像是写文章,他们不需那么多背景知识,因为他们其实已经对一些知识形成一种共识.

例如数学家会直接用这样的公式来描述 向量:

共识可以提高交换的效率,有这种味道吧

当空间本身也在变换,向量会怎么被影响

向量的运算,研究的是向量本身在它所处空间的变换. *这时候,我们不禁提出疑问: 要是向量存在的基础: 它所在的空间发生变化了, 会怎么影响它自身的存在? *

但提出这个问题的时候,研究的方向就有了一个分支, 其中一个就是线性代数.

** 线性代数本质来说就是研究空间的线性变换,而空间的线性变换的过程, 可以通过一个矩阵来描述** . 这句话很绕很难理解, 尤其对还没看过视频的同学.为什么空间的线性变换就可以使用一个矩阵来描述?
我的理解是, 矩阵只是一个载体,它向我们传递了空间是如何变换的.思路是这样的:

空间变换–> 我们需要描述变化前,变化后的空间–>因为是线性变换(有叠加性) –>所以要是能确定某个向量变化过程,那我们就能以此描述整个空间的变换 –> 而矩阵可以记录基向量变换后的位置

ps :按照我上面的推论, 描述三维空间变换的应该是一个3x3的方阵,分别对应i,j,k 三个坐标轴的变换. 当实际中,我们会看到行列不等的矩阵,因为那是一种特殊的空间变换:空间被压缩了.

所以,线性代数本身就是一个载体,研究空间的工具.我们通常只看到一堆密密麻麻的数字,但却不知道它实际的内涵.这也是我从视频中最大的收获.

Linear algebra gives the data analyst a nice way to conceptualize many lists of numbers in a visual way,which can seriously clarify patterns in data ,and give a global vies of what certain operations do . And on the flip side, it gives people like physicists and computer graphics programmers a language to describe space and the manipulation of space using numbers that can be crunched and run through a computer .

线性代数为数据分析提供了一条将大量数据列表概念化, 可视化的渠道, 它让数据模式变得非常清晰,并让你大致了解特定运算的意义. 另一方面,线性代数给物理学家和计算机图形程序员提供了一种语言,让他们能通过计算机能处理的数
字来描述并操纵空间

一种特殊的情况:空间变换,有些向量可能”保持原样”

第一个能想到的就是 原点. 但我们当然不会就此满足

对于数学家, 他们也没有那么啰嗦, 一个公式描述这样的一个特性:

1
2
3
向量ℳ 在空间变换F的作用下,输出结果仍然是ℳ.这是一个有个性的,有点拽的向量.

F(ℳ) = ℳ

当然,这里的保持原样不一定要是一模一样,我们放宽条件,可以拉伸,也可以反方向, 但输出结果的方向不能改变.于是乎有:

1
F(ℳ) = kℳ

这样的一种形式就出现了 特征值和特征向量这两个概念.或者说,在特定空间变换F下, 它对应的特征值和特征向量

那这样的能保持自我的向量有什么作用呢? 在空间上直观来说: 这个向量就是二维空间的对称轴, 三维空间的旋转轴. 随着空间的变换能保持自身的不变, 我们知道,原点也是具有这个特质的. 所以特征向量可以认为是具有原点性质的特殊向量.要是你愿意,它成为你新变换后的原点.get 到点了么? 就是不同视角下两个等价的东西, 当然,不是每个空间变换都有旋转轴,对应的术语是: 不是每个矩阵都有对应的特征向量.

变换后带来的一些问题

下面这些概念,都是为了研究空间变换后带来的一些问题, 下面我不希望你像是在看概念一样,你应该去想象这些描述.为什么要有这些概念,还能有哪些概念, ?

空间变换结果, 使得原来单位面积(单位体积)的变化比例, 这个叫做** 行列式**

我们刚刚提到,有一些空间的变换, 它是能够把空间压缩的,压缩成一个面,一条直线,甚至一个点.

  1. 描述变换前后是否发生压缩, 我们可以计算行列式的值是否等于0 (想想为什么)
  2. 当我们想知道,变换之后空间的维度, 我们可以计算 “矩阵的秩”

有变换就会有”复原”, 这个叫做 矩阵的逆.

另一种视角: 不同基准的空间如何”沟通”

当我们选择了一个原点作为我们的参考系,必然有其他不同的人选择了不同的参考系. 这就带来了一个问题, 我们要怎么理解别人空间的变换?

因为我们基准是我们人为规定的,就像自然语言,你要如何向英国人描述”鸡蛋”这个词? 对方不知道”鸡蛋”, 你不知道”egg” ,但你们可以有翻译.例如,画一个 🥚.

基变换 描述的就是这样一种场景.

名词学习

  • linear algebra 线性代数

  • vector 向量

  • fundamental operations 基本运算

  • vector addition 向量加

  • scalar multiplication 向量数乘

  • Scaling 缩放

  • Scalars 标量

  • linear transformations 线性变换

  • composition of two separate transformations 两个独立变换地”复合变换”

  • the determinant of a transformation 线性变换的行列式

  • rank 秩

  • duality 对偶性

  • change of basis 基变换

最后附上

欢迎用Dogecoin支持我不断记录