现代 AI 建立在三个数学支柱之上:线性代数让机器学会"表示", 微积分让它学会"优化",概率让它 学会"推断"。这份指南为每一条路径都规划了从直觉到前沿的四步进阶,最后再用一章把三条路汇成一张地图。
向量、矩阵、空间、变换。AI 里的"数据"——图像、文本、embedding——本质上都是向量。 而训练一个模型,是在某个高维空间里不停地旋转、投影、分解。
极限、导数、梯度、链式法则。反向传播是链式法则的大规模自动化。每一次神经网络的参数更新, 都是一次"沿着梯度向下"的微积分运算。
分布、贝叶斯、期望、熵。现代 ML 的本质是"从数据里估计一个分布", 从朴素贝叶斯到扩散模型,每一步都是对不确定性的建模。
线性代数不是一门关于数字的学科,它是一门关于空间、关于变换的学科。
几乎每一个学习算法,本质上都在做一件事 —— 定义一个损失函数,然后沿着它的梯度往下走。
机器学习,本质上是一种认识论 —— 它告诉我们,在有限的数据里,应该如何形成合理的信念。