📚 技术学习记录 · 🤖 右下角找小创AI助手

技术学习记录

强化学习基础

正在初始化搜索引擎

首页
学习路线
2028就业升级导航
知识图谱
学习规划
🧠 AI核心理论
🔧 AI工程与工具
📐 数学与算法
💻 编程语言
🏗️ 系统与架构
☁️ 工程实践
🌐 应用开发
🎓 求职面试
📦 选修

技术学习记录

首页
学习路线
2028就业升级导航
知识图谱
学习规划
🧠 AI核心理论
🧠 AI核心理论
🔧 AI工程与工具
📐 数学与算法
💻 编程语言
🏗️ 系统与架构
☁️ 工程实践
🌐 应用开发
🎓 求职面试
📦 选修

目录

本章内容

首页
🧠 AI核心理论
强化学习
强化学习基础

强化学习基础¶

本章内容¶

什么是强化学习
马尔可夫决策过程
贝尔曼方程
动态规划
蒙特卡洛方法
理论基础统一框架
收敛性与复杂度理论
统计学习理论视角

⚠️ 核验说明（2026-03-26）：本页已纳入 2026-03-26 全站统一复核批次。若文中涉及外部模型、API、版本号、价格或第三方产品名称，请以官方文档和实际运行环境为准。

最后更新日期： 2026-03-26

00-学习指南

01-什么是强化学习

© 2025-2026 技术学习记录 · YZ | 苏ICP备2026009577号-1

首页
搜索
目录
AI助手