Vol. V · The Complete Graduate Edition
微积分的高阶形态 → AI 研究
The Missing Volume
The Missing Volume · 被拆散的微积分

当微积分
换了 名字
进入 AI 研究。

这一卷补齐前几卷里被分散的"高阶微积分"。 研究生层面,单纯的微积分不再单独存在——它分化成了 微分几何李群与表示论偏微分方程与变分法流形优化随机分析在 AI 的应用。 这些方向,是 2024 年之后 AI 前沿论文真正依赖的数学。

⚠ 说明 —— 这一卷不是补习,是扩展。 它假设你已经读过前四卷。如果你想研究等变神经网络、几何深度学习、扩散模型、PINN、Neural ODE、物理启发 AI, 这一卷是你真正需要的书。
§ 为什么说微积分在前卷"被拆散了"

一个科目,五个名字

本科"多变量微积分"
微分几何 · 流形 · 切丛 · Riemann 度量
本科"向量场旋度散度"
李群 · 李代数 · 表示论
本科"偏导 + 积分"
偏微分方程 · 变分法 · Sobolev 空间
本科"有约束求极值"
流形上的优化 · Riemannian 梯度法
本科"带随机扰动的导数"
随机分析 · SDE · 扩散生成模型
I
Track I · Differential Geometry

第一卷 · 微分几何

微分几何把微积分搬到"弯曲的空间"上。流形、切空间、Riemann 度量、曲率 —— 这是几何深度学习、信息几何、Wasserstein 梯度流、神经 ODE 的共同语言。 曲线、曲面、光滑流形、黎曼流形,逐层展开。
流形
切丛
微分形式
Stokes 定理
Riemann 度量
曲率
测地线
I.Tier 1 · Curves & Surfaces

曲线 · 曲面 · 初识几何

进入流形之前,先在二三维空间里建立几何直觉。高斯曲率、平均曲率、Gauss-Bonnet 定理 —— 这些概念在高维推广时会是熟悉的朋友。
先修:本科多变量微积分 + 线代。
I.Tier 2 · Smooth Manifolds

光滑流形

真正的现代微分几何从这里开始。流形、切丛、微分形式、Lie 导数 —— 这些是几何深度学习、等变网络、张量场网络的基础语言。
先修:Tier 1 + 一般拓扑 + 实分析基础。
I.Tier 3 · Riemannian Geometry

黎曼几何

给流形配上"度量"之后,就有了距离、角度、测地线、曲率——这是几何深度学习Riemannian 优化的直接数学基础。Bronstein 的几何 DL 原书每一页都在引用这一层。
先修:Tier 2(John Lee 光滑流形 或 Tu)。
06
★ 首选教材John Lee · GTM 176
Introduction to Riemannian Manifolds
John M. Lee · 第 2 版
2018 · Springer GTM 176 · 437 pages
Lee 三部曲的顶峰。联络、测地线、指数映射、曲率张量、比较定理 —— 黎曼几何的核心内容。第 2 版扩充并重组,是当代最友好的 Riemann 几何教材。
信息几何里的"测地线"、超双曲嵌入都在这。
07
do Carmo · 经典GTM 经典续作
Riemannian Geometry
Manfredo P. do Carmo
1992 · Birkhäuser · 300 pages
do Carmo 的 Riemann 几何是另一个世界级选择。比 Lee 更紧凑,证明技巧更精到。特别是曲率和比较几何的处理很经典。
关于"曲率控制形状"这件事,do Carmo 讲得最美。
08
研究者向Petersen
Riemannian Geometry
Peter Petersen · 第 3 版
2016 · Springer GTM 171 · 499 pages
比 Lee 更偏现代研究视角。比较几何、Ricci 流动、收敛性 —— Villani 的最优传输里大量用到 Ricci 曲率理论,Petersen 就是通路。
Wasserstein 几何背后的 Ricci 曲率在这里。
09
应用向Jost · 数据科学视角
Riemannian Geometry and Geometric Analysis
Jürgen Jost · 第 7 版
2017 · Springer Universitext · 697 pages
除了标准 Riemann 几何内容,特别覆盖调和映射、Morse 理论、几何变分问题 —— 这些是数据流形学习、谱方法、深度学习损失曲面分析的直接工具。
神经网络损失曲面 = Morse 理论的应用场景。

理解了一个流形的曲率,就理解了它上面所有函数的命运。

— Peter Petersen · UCLA
II
Track II · Lie Groups, Lie Algebras & Representation Theory

第二卷 · 李群
与表示论

对称性是深度学习的一等公民。平移、旋转、置换、规范变换 —— 都是李群。 E(3)-Transformer、SE(3) 等变 CNN、群卷积网络、等变 GNN —— 这些现代架构全建立在李群和表示论之上。
矩阵李群
李代数
指数映射
根系与权
酉表示
紧群
半单李代数
II.Tier 1 · Matrix Lie Groups

矩阵李群入门

从"摸得着"的矩阵李群开始,避开抽象流形。Hall 的那本书是最好的桥梁 —— 用线代就能读,但最后达到半单李代数结构理论的高度。
先修:扎实的线代 + 基础分析。
II.Tier 2 · Representation Theory

表示

表示论是"群如何作用于向量空间"——这恰好是等变神经网络的数学定义。不可约表示、Peter-Weyl 定理、Young 图、特征理论。
先修:Hall 的李群书 + 线代成熟度。

深度学习里的每一个归纳偏置,往往就是某个群的对称性的代数表达。

— Michael Bronstein · Oxford · Geometric Deep Learning
III
Track III · PDE · Calculus of Variations · Optimal Control

第三卷 · PDE · 变分
与最优控制

AI 与 PDE 的融合,是 2023 年之后最强的研究浪潮之一。PINN 直接用神经网络拟合 PDE 解; 扩散模型的 reverse-time SDE 对应一个 Fokker-Planck 方程;RL 的 HJB 方程直接来自最优控制; Neural ODE 本质上是 ODE 逆问题 —— 这一卷是这场浪潮的数学基础。
偏微分方程
Sobolev 空间
变分法
Fokker-Planck
HJB 方程
Pontryagin 原理
III.Tier 1 · PDE Foundations

PDE 基础

本科 PDE 课讲的是解方程的技巧;研究生 PDE讲的是方程背后的理论 —— 存在性、正则性、能量方法、弱解。
先修:实分析(Rudin 或 Folland) + 泛函分析基础(Brezis)。
III.Tier 2 · Calculus of Variations

变分

"从无穷多函数里找最优那一个" —— 变分法是所有生成模型(GAN、VAE、扩散模型)的原理。Euler-Lagrange、直接法、Γ-收敛。
先修:PDE 基础 + 测度论。
III.Tier 3 · Optimal Control

最优控制理论

连续时间 RL、Neural ODE 训练、最优策略 —— 所有这些问题本质上是最优控制。Pontryagin 最大值原理和 Hamilton-Jacobi-Bellman 方程是这一层的两大支柱。
先修:ODE + 基础泛函分析。

Neural ODE 看似是一种新想法,实际上是把最优控制的一百年历史接入了神经网络。

— Ricky T. Q. Chen · Neural ODE author
IV
Track IV · Optimization on Manifolds

第四卷 · 流形上的
优化

当参数空间不是欧氏空间,梯度下降必须搬到流形上。 正交约束、低秩约束、旋转群上的优化 —— 这些都需要Riemannian 梯度retractionvector transport。这是现代深度学习里一个独立且快速成长的分支。
Retraction
Vector transport
Stiefel/Grassmann
测地凸性
Riemannian SGD
PyManopt
IV.Core Texts · 唯一一门学科

流形优化的核心书

这门学科相对年轻,经典书不多但都很权威。两本核心教材 + 两本参考,基本覆盖整个方向。
先修:微分几何 Tier 2(光滑流形) + 凸优化基础。
25
★★ 奠基之作Absil · Mahony · Sepulchre · 免费在线
Optimization Algorithms on Matrix Manifolds
P.-A. Absil · Robert Mahony · Rodolphe Sepulchre
2008 · Princeton · 240 pages · 免费 PDF
定义了"流形优化"这门学科。Retraction(退却)、vector transport、Stiefel 和 Grassmann 流形上的梯度法、共轭梯度、牛顿法。每一个现代 Riemannian 优化算法的祖先都在这本书里。Princeton 提供免费完整在线版。
正交神经网络训练、LoRA 理论分析都从这本书出发。
26
★★ 现代教材Boumal · Cambridge · 免费 PDF
An Introduction to Optimization on Smooth Manifolds
Nicolas Boumal
2023 · Cambridge · 408 pages · 免费预印版
Absil 之后 15 年的现代教材。无先修几何基础的读者也能学 —— 它把必要的微分几何和 Riemannian 几何嵌入书中。覆盖测地凸性、Riemannian SGD、大规模问题。配套 EPFL MATH-512 录像 + Manopt/PyManopt 工具包。
想做流形优化的新人 —— 直接从 Boumal 起步。
27
测地凸优化Sra · Bacák
An Invitation to Geodesic Convex Optimization
Suvrit Sra · Miroslav Bacák
2023 · Springer Briefs
测地凸优化 —— 在非欧空间里推广凸性。流形上的分布鲁棒、Hadamard 空间、metric 优化。是流形优化与 ML 连接的新前沿。
双曲空间嵌入的训练算法基础。
28
综述参考Foundations and Trends
Riemannian Optimization: A Survey
Reshad Hosseini · Suvrit Sra
2020 · Foundations and Trends in Optimization
流形优化在机器学习里最近十年进展的综述。涵盖非凸 Riemannian 随机方法、分布式情形、正则化。
跟踪最新算法复杂度结果的起点。

很多看似"非凸"的 ML 问题,换到一个合适的流形上就变成了凸的。

— Suvrit Sra · MIT · TU München
V
Track V · Stochastic Analysis for AI & Diffusion Models

第五卷 · 随机分析
在 AI 的应用

扩散模型、score matching、flow matching —— 整个当代生成式 AI 的数学核心都是随机分析。 前卷里提到了经典的 Øksendal、Karatzas-Shreve,但它们离 AI 应用还有距离。这里的书是专门为 AI 研究者写,或者直接写应用的新书。
Itô 积分
Fokker-Planck
Score matching
Langevin 动力学
Flow matching
粒子滤波
V.Tier 1 · SDE for Practitioners

SDE 实战版

比 Øksendal 轻一些、比工程书严谨一些。这一层是为数据科学和 AI 研究者专门写的 SDE 书。
先修:概率论(测度论版本) + ODE。
V.Tier 2 · Fokker-Planck & Langevin

Fokker-Planck & Langevin

扩散模型 = 前向 SDE + 逆向 SDE + Fokker-Planck 方程的配对。MCMC、Langevin 采样、score matching 背后的理论都在这一层。
先修:测度论概率 + PDE 基础。

扩散模型之美,在于它把加噪声变成了一个可以精确反演的随机过程。

— Yang Song · OpenAI · Score-based SDE
VI
Track VI · Frontier Math for AI

第六卷 · 跨界 AI
数学前沿

几本综合性的"AI 数学前沿"专书,用本卷 I-V 的所有工具,直接进入 AI 研究前线。 这些书都是 2020 年之后出版的新书。
几何 DL
等变 NN
PINN
信息几何
Neural ODE
VI.Integrated Frontier

融合 · 综合前线

每一本都是单一方向的"当代标杆",都建立在前卷多个主题的基础上。
35
★★ 几何深度学习圣经免费 Proto-book
Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, Gauges
Michael Bronstein · Joan Bruna · Taco Cohen · Petar Veličković
2021 · 免费 Proto-book · 160+ pages
用对称性和群论重新组织整个深度学习。证明 CNN、GNN、Transformer 其实是同一个几何框架的不同特例。读它需要本卷几乎所有工具:微分几何、李群、表示论。
可能是 2020 年代最重要的 AI 理论专书。
36
信息几何权威Amari · Springer
Information Geometry and Its Applications
Shun-ichi Amari
2016 · Springer · 374 pages
Amari 是信息几何创始人。Fisher 信息矩阵、自然梯度、指数族的几何结构。Natural gradient 的真正来源,比 Adam 深得多的优化思想。
Natural policy gradient、Fisher information regularization。
37
Amari · Nagaoka更深
Methods of Information Geometry
Shun-ichi Amari · Hiroshi Nagaoka
2000 · AMS · 206 pages
信息几何的另一本权威。双重仿射联络、α-divergence、投影定理。比 #36 数学更紧,但覆盖更深。
KL 散度的几何解释从这里最清楚。
38
★ 物理视角Roberts · Yaida · Hanin
The Principles of Deep Learning Theory
Daniel A. Roberts · Sho Yaida · Boris Hanin
2022 · Cambridge · 472 pages · arXiv 免费
从重整化群、有效场论(量子场论)的视角构建深度学习理论。Criticality、相变、无限宽极限。这本书把物理和 AI 的数学融合推到前所未有的深度。
NTK、feature learning 等理论的统一视角。
39
PINN 综述专书arXiv 持续更新
Scientific Machine Learning Through Physics-Informed Neural Networks
Salvatore Cuomo 等 · 综述专书
2022 / 持续更新 · arXiv
PINN 领域最完整的综述之一。涵盖 PINN 的数学基础、收敛性分析、多种架构变体、真实 PDE 应用案例。适合想系统进入这个方向的人。
科学 AI / SciML 方向的综合入口。
40
Neural ODE 综述arXiv
Neural Differential Equations
Patrick Kidger · PhD Thesis
2021 · Oxford · 231 pages
Kidger 的牛津博士论文。Neural ODE、Neural CDE、Neural SDE 的完整理论 + 实现。他也是 diffrax 库的作者 —— 理论与代码一体。
Neural ODE 方向最权威的单一文献。
§ Direction Map · 按研究方向的书单

五个 AI 前沿方向 的专题路径

Direction A · 几何 DL

等变神经网络 · SE(3) · GNN

  • John Lee · Smooth Manifolds#03 · 流形基础
  • Hall · Lie Groups#10 · 李群必读
  • Fulton & Harris · Rep Theory#13 · 表示论
  • Bröcker & tom Dieck#14 · 紧李群深入
  • Bronstein et al. · GDL#35 · 统一框架
Direction B · 生成模型

扩散 · 流匹配 · SDE 生成

  • Särkkä · Solin · Applied SDE#29 · SDE 核心
  • Risken · Fokker-Planck#32 · 反向扩散
  • Pavliotis · Stoch Processes#33 · Langevin
  • Flow Matching & Diffusion#34 · 最新专书
  • Villani · Optimal Transport(卷 IV #25)
Direction C · 科学 AI

PINN · Neural ODE · SciML

  • Evans · PDE#16 · PDE 基础
  • Giusti · Direct Methods#19 · 变分法
  • Liberzon · Optimal Control#22 · 控制论
  • Kidger · Neural DE#40 · NODE 综述
  • Cuomo et al. · PINN#39 · 方向综述
Direction D · 流形学习

Riemannian 优化 · 低秩 · LoRA

  • do Carmo · Riemannian Geo#07 · 几何基础
  • Absil et al. · Matrix Manifolds#25 · 流形优化奠基
  • Boumal · Smooth Manifolds#26 · 现代教材
  • Sra & Bacák · Geodesic Convex#27 · 新前沿
  • Amari · Info Geometry#36 · Natural grad