跳转至

大模型应用开发教程

⚠️ 时效性说明:本章涉及前沿模型/价格/榜单等信息,可能随版本快速变化;请以论文原文、官方发布页和 API 文档为准。

从Prompt工程到RAG系统、从Agent框架到模型微调、从推理优化到生产部署,全面掌握LLM应用开发的核心技术栈。

📌 定位说明:本教程覆盖LLM应用开发的完整技术栈,是实战导向的工程教程。与本仓库其他模块的关系: - 理论基础(Transformer原理、注意力机制数学推导)→ LLM学习 - Agent专项实战(手写Agent、MCP Server开发、多Agent系统)→ AI Agent开发实战 - 深度学习基础(CNN/RNN/优化器)→ 深度学习

🔗 Agent相关内容导航:本仓库Agent内容形成完整学习路径 → LLM学习(理论)→ 本目录(框架应用)→ AI Agent开发实战(深度实战)

📖 教程简介

大语言模型(LLM)正在重塑软件开发范式。本教程提供从入门到进阶的系统化学习路径,覆盖25章核心内容(00-学习指南 + 01-24章),帮助你掌握LLM应用开发的全部关键技术。

本教程的优势: - 📊 25章覆盖LLM应用全栈(00-学习指南 + 01-24章),远超同类教程的广度 - 🔧 工程导向:每章包含完整可运行代码示例 - 🏗️ 架构思维:专设应用架构设计、推理优化、生产部署章节 - 📈 持续更新:跟踪2024-2026年前沿模型与技术发展 - 🎯 面试准备:配套面试题库和项目案例

🎯 学习目标

完成本教程后,你将能够:

  • ✅ 熟练运用Prompt工程、思维链和上下文学习技术
  • ✅ 独立构建RAG系统(基础→高级),集成向量数据库
  • ✅ 使用LangChain/LlamaIndex/LangGraph/CrewAI开发复杂应用
  • ✅ 掌握LoRA/QLoRA微调方法,训练领域专属模型
  • ✅ 实现模型部署与推理优化(量化/KV Cache/投机解码)
  • ✅ 设计生产级LLM应用架构(安全/对齐/可观测性)
  • ✅ 应对大模型应用方向的技术面试

📖 前置知识

领域 要求 推荐资料
Python编程 函数、类、装饰器、async/await Python开发
机器学习基础 损失函数、梯度下降、过拟合 机器学习
深度学习基础 神经网络、反向传播 深度学习
REST API HTTP方法、JSON、请求库 -
Git基础 克隆、提交、分支 Git与版本控制

🛠️ 推荐工具

工具 用途 安装方式
Python 3.11+ 编程语言 python.org
OpenAI API 大模型API pip install openai
LangChain 应用开发框架 pip install langchain langchain-openai
LlamaIndex 数据框架 pip install llama-index
ChromaDB 向量数据库 pip install chromadb
Hugging Face 模型与数据集 pip install transformers datasets
PEFT 高效微调 pip install peft
vLLM 推理加速 pip install vllm
uv 包管理 pip install uv

📚 目录结构

Text Only
LLM应用/
├── README.md                              # 教程导航(本文件)
├── 00-学习指南.md                          # 学习路线建议
│   ── 第一阶段: Prompt与推理 ──
├── 01-大模型应用概述.md                     # LLM生态、API调用、应用类型
├── 02-Prompt工程.md                        # 提示词设计、系统提示、模板
├── 03-上下文学习.md                         # ICL、Few-shot、动态示例选择
├── 04-思维链与推理.md                       # CoT、ToT、Self-Consistency
├── 22-结构化输出与函数调用.md      # JSON输出、工具调用、格式控制
│   ── 第二阶段: RAG与检索增强 ──
├── 05-RAG系统构建.md                        # RAG架构、文档处理、检索生成
├── 06-向量数据库.md                         # Embedding、Chroma/Pinecone/Weaviate
├── 18-高级RAG技术.md                        # 混合检索、重排序、查询改写、GraphRAG
│   ── 第三阶段: 框架与Agent ──
├── 07-Agent开发基础.md                      # ReAct范式、工具调用、Agent循环
├── 08-LangChain框架.md                     # Chain/Agent/Memory/Retriever
├── 16-LlamaIndex框架.md                    # 数据连接器、索引、查询引擎
├── 17-多Agent框架.md                        # LangGraph/CrewAI/AutoGen对比
├── 19-Agent评估与可观测性.md                 # LangSmith/Phoenix/评测方法
│   ── 第四阶段: 微调与定制 ──
├── 09-大模型微调技术.md                      # Full FT/PEFT/数据准备
├── 10-LoRA与QLoRA.md                       # LoRA原理/QLoRA/训练实战
│   ── 第五阶段: 部署与生产 ──
├── 11-大模型部署.md                         # Ollama/vLLM/TGI部署方案
├── 12-推理优化.md                           # 量化/KV Cache/投机解码/Flash Attention
├── 20-大模型应用架构设计.md                   # 系统架构、容错、扩展性设计
│   ── 专题与前沿 ──
├── 13-多模态应用.md                         # Vision/Audio/Video多模态LLM
├── 14-大模型安全与对齐.md                    # 越狱防护、RLHF、Red Teaming
├── 15-大模型应用案例.md                      # 翻译/摘要/客服/教育等案例
├── 21-前沿模型横评-2024到2026.md            # GPT-4o/Claude/Gemini/DeepSeek对比
├── 23-Gradio构建AI应用.md                    # Gradio快速构建交互式AI应用界面
├── 24-多模态RAG与向量数据库进阶.md            # 多模态Embedding/Milvus/Text2SQL
│   ── 实战与面试 ──
├── 实战项目/                                # 端到端项目源码
├── 测试用例/                                # 单元测试与集成测试示例
├── 面试准备/                                # LLM应用面试题库
└── images/                                 # 插图资源

📊 章节索引

第一阶段:Prompt与推理基础

章节 内容 关键技术 预计学时
00-学习指南 学习路线与资源推荐 - 0.5小时
01-大模型应用概述 LLM生态与应用类型 API调用、Token计费、模型选择 3小时
02-Prompt工程 提示词设计方法论 系统提示、模板、少样本、角色扮演 6小时
03-上下文学习 In-Context Learning Few-shot、动态示例、示例选择策略 4小时
04-思维链与推理 推理增强技术 CoT、ToT、Self-Consistency、ReAct 5小时
22-结构化输出 输出格式控制 JSON Schema、Function Calling、Pydantic 4小时

第二阶段:RAG与检索增强

章节 内容 关键技术 预计学时
05-RAG系统构建 RAG架构与实现 文档切分、Embedding、检索+生成 8小时
06-向量数据库 向量存储与检索 Chroma/Pinecone/Weaviate、相似度搜索 6小时
18-高级RAG技术 RAG进阶 混合检索、重排序、查询改写、GraphRAG 8小时

第三阶段:框架与Agent

章节 内容 关键技术 预计学时
07-Agent开发基础 Agent核心概念 ReAct、工具调用、Agent循环 6小时
08-LangChain框架 LangChain全栈 Chain/Agent/Memory/Retriever/LCEL 10小时
16-LlamaIndex框架 数据连接与查询 数据连接器、索引类型、查询引擎 8小时
17-多Agent框架 多Agent对比 LangGraph/CrewAI/AutoGen/MetaGPT 6小时
19-Agent评估 评估与可观测 LangSmith、Phoenix、LLM-as-Judge 4小时

第四阶段:微调与定制

章节 内容 关键技术 预计学时
09-大模型微调技术 微调方法论 Full FT/Adapter/Prefix/数据准备 6小时
10-LoRA与QLoRA 高效微调实战 LoRA原理/秩选择/QLoRA/训练代码 8小时

第五阶段:部署与生产

章节 内容 关键技术 预计学时
11-大模型部署 部署方案对比 Ollama/vLLM/TGI/ONNX Runtime 6小时
12-推理优化 推理加速技术 量化(GPTQ/AWQ)/KV Cache/投机解码 8小时
20-应用架构设计 系统架构 微服务/消息队列/容错/扩展性 6小时

专题与前沿

章节 内容 关键技术 预计学时
13-多模态应用 多模态LLM GPT-4V/Gemini Vision/音频/视频 5小时
14-安全与对齐 LLM安全 越狱防护/RLHF/Red Teaming/内容安全 4小时
15-应用案例 行业应用 翻译/摘要/客服/教育/代码/医疗 4小时
21-前沿模型横评 模型对比 GPT-4o/Claude 4/Gemini 2.5/DeepSeek-R1 3小时
23-Gradio构建AI应用 AI应用界面 Interface/Blocks/ChatInterface/HF Spaces 5小时
24-多模态RAG与向量数据库进阶 进阶RAG CLIP/BGE-M3/Milvus/Text2SQL/RAGAS评估 8小时

🗺️ 学习路线图

总学时:约110小时 建议周期:11-12周(全职学习每周10小时,在职学习每周5-6小时)

Text Only
第1-2周: Prompt与推理基础 (约30小时)
  ├── 大模型应用概述与API调用
  ├── Prompt工程方法论
  ├── 上下文学习与Few-shot
  ├── 思维链与推理增强
  └── 结构化输出与Function Calling
第3-4周: RAG系统开发 (约22小时)
  ├── RAG基础架构与实现
  ├── 向量数据库选型与使用
  ├── 高级RAG技术
  └── 🔗 实战: 构建知识库问答系统
第5-7周: 框架与Agent (约34小时)
  ├── LangChain框架全栈
  ├── LlamaIndex数据框架
  ├── Agent开发基础
  ├── 多Agent框架对比
  ├── Agent评估与可观测性
  └── 🔗 实战: 构建研究助手Agent
第8-9周: 微调与部署 (约20小时)
  ├── 大模型微调方法论
  ├── LoRA/QLoRA训练实战
  ├── 模型部署方案
  ├── 推理优化技术
  ├── 应用架构设计
  └── 🔗 实战: 微调+部署垂直领域模型
第10-12周: 专题与面试 (约4小时 + 实战)
  ├── 多模态/安全/对齐
  ├── 前沿模型横评
  ├── 面试题库突击
  └── 项目整理与简历优化

💡 学习建议

  1. 按阶段推进:建议按"Prompt→RAG→Agent→微调→部署"的顺序学习
  2. 先跑通代码:每章代码先运行成功,再理解原理
  3. 结合项目:每完成一个阶段就做对应的实战项目
  4. 横向对比:学完LangChain和LlamaIndex后,对比两者的设计哲学
  5. 关注前沿:第21章模型横评定期更新,保持技术敏感度
  6. 交叉引用:Agent进阶内容参见 AI Agent开发实战

🔗 推荐资源

官方文档

优质课程

论文推荐

  • "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks" (Lewis et al., 2020)
  • "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models" (Wei et al., 2022)
  • "LoRA: Low-Rank Adaptation of Large Language Models" (Hu et al., 2021)
  • "vLLM: Efficient Memory Management for Large Language Model Serving" (Kwon et al., 2023)

📊 学习进度

章节 阅读 代码实践 实战项目
01-大模型应用概述 -
02-Prompt工程
03-上下文学习
04-思维链与推理
05-RAG系统构建
06-向量数据库
07-Agent开发基础
08-LangChain框架
09-大模型微调技术
10-LoRA与QLoRA
11-大模型部署
12-推理优化
13-多模态应用
14-安全与对齐 -
15-应用案例
16-LlamaIndex框架
17-多Agent框架
18-高级RAG技术
19-Agent评估
20-架构设计
21-前沿模型横评 - -
22-结构化输出
23-Gradio构建AI应用
24-多模态RAG进阶

🚀 开始学习

准备好了吗?建议从学习指南开始了解全局,然后进入第一章!

学习指南: 00-学习指南 第一步: 01-大模型应用概述


提示: 本教程建议配合Python 3.11+和OpenAI API使用。Agent深度内容请参见 AI Agent开发实战

祝你学习愉快! 🎉


最后更新日期:2026-02-16 适用版本:LLM应用指南 v2026.02