📐 AI数学基础教程¶

定位：AI研究生必修 | 前置知识：高等数学、Python基础 核心理念：手推公式 → 代码验证 → 联系AI场景

📚 教程简介¶

AI的核心是数学。本教程聚焦AI/ML/DL中最常用的数学工具，每个公式都配有Python代码验证和AI应用场景，帮助你：

面试中能手推反向传播、Softmax梯度、注意力机制
理解为什么用交叉熵损失、为什么Adam要偏差修正
建立从数学到算法的直觉联系

🗺️ 学习路线图¶

Text Only

线性代数 ──→ 概率统计 ──→ 优化理论 ──→ 信息论与数学工具
(向量/矩阵    (分布/估计    (梯度下降     (Softmax/反向传播
 SVD/PCA)     贝叶斯/EM)    Adam/凸优化)   注意力推导)

📖 章节导航¶

编号	章节	核心内容	难度	学习时间
01	线性代数	向量/矩阵/SVD/PCA/注意力矩阵	⭐⭐⭐	8-10小时
02	概率统计	贝叶斯/MLE/EM/KL散度/交叉熵	⭐⭐⭐⭐	8-10小时
03	优化理论	SGD/Adam/凸优化/KKT/学习率调度	⭐⭐⭐⭐⭐	8-10小时
04	信息论与数学工具	互信息/Softmax推导/反向传播/注意力推导	⭐⭐⭐⭐	6-8小时

🛠️ 推荐工具¶

工具	用途
NumPy	数值计算验证
PyTorch	AI场景代码
Matplotlib	可视化
SymPy	符号计算验证推导

💡 学习建议¶

先手推再看答案 — 每个推导先自己在纸上完成
代码验证 — 用NumPy代码验证每个数学结论
联系AI — 每学一个数学工具，想想它在ML/DL中哪里出现过
面试导向 — 每章末的面试题是高频考点，必须掌握

✅ 总学习检查清单¶

能手写SVD分解并解释与PCA的关系
能推导MLE和贝叶斯公式，解释KL散度
能推导Adam优化器的更新公式
能手推Softmax梯度和两层网络反向传播
能解释注意力机制为什么除以\(\sqrt{d_k}\)

最后更新日期：2026-02-12 适用版本：AI数学基础教程 v2026