📐 AI数学基础教程¶
定位:AI研究生必修 | 前置知识:高等数学、Python基础 核心理念:手推公式 → 代码验证 → 联系AI场景
📚 教程简介¶
AI的核心是数学。本教程聚焦AI/ML/DL中最常用的数学工具,每个公式都配有Python代码验证和AI应用场景,帮助你:
- 面试中能手推反向传播、Softmax梯度、注意力机制
- 理解为什么用交叉熵损失、为什么Adam要偏差修正
- 建立从数学到算法的直觉联系
🗺️ 学习路线图¶
Text Only
线性代数 ──→ 概率统计 ──→ 优化理论 ──→ 信息论与数学工具
(向量/矩阵 (分布/估计 (梯度下降 (Softmax/反向传播
SVD/PCA) 贝叶斯/EM) Adam/凸优化) 注意力推导)
📖 章节导航¶
| 编号 | 章节 | 核心内容 | 难度 | 学习时间 |
|---|---|---|---|---|
| 01 | 线性代数 | 向量/矩阵/SVD/PCA/注意力矩阵 | ⭐⭐⭐ | 8-10小时 |
| 02 | 概率统计 | 贝叶斯/MLE/EM/KL散度/交叉熵 | ⭐⭐⭐⭐ | 8-10小时 |
| 03 | 优化理论 | SGD/Adam/凸优化/KKT/学习率调度 | ⭐⭐⭐⭐⭐ | 8-10小时 |
| 04 | 信息论与数学工具 | 互信息/Softmax推导/反向传播/注意力推导 | ⭐⭐⭐⭐ | 6-8小时 |
🛠️ 推荐工具¶
| 工具 | 用途 |
|---|---|
| NumPy | 数值计算验证 |
| PyTorch | AI场景代码 |
| Matplotlib | 可视化 |
| SymPy | 符号计算验证推导 |
💡 学习建议¶
- 先手推再看答案 — 每个推导先自己在纸上完成
- 代码验证 — 用NumPy代码验证每个数学结论
- 联系AI — 每学一个数学工具,想想它在ML/DL中哪里出现过
- 面试导向 — 每章末的面试题是高频考点,必须掌握
✅ 总学习检查清单¶
- 能手写SVD分解并解释与PCA的关系
- 能推导MLE和贝叶斯公式,解释KL散度
- 能推导Adam优化器的更新公式
- 能手推Softmax梯度和两层网络反向传播
- 能解释注意力机制为什么除以\(\sqrt{d_k}\)
最后更新日期:2026-02-12 适用版本:AI数学基础教程 v2026