大模型应用开发 - 详细学习指南¶
⚠️ 时效性说明:本章涉及前沿模型/价格/榜单等信息,可能随版本快速变化;请以论文原文、官方发布页和 API 文档为准。
📚 学习总览¶
本指南为清华大学计算机技术专业专硕及985 AI专业本科生量身定制,提供系统性的大模型应用开发学习路径。目标是帮助你在16-20周内掌握大模型应用开发的核心理论和工程实践能力,为进入字节跳动、腾讯、阿里巴巴、百度、大疆、影石等互联网大厂做好准备。
🎯 学习目标¶
短期目标(1-3个月)¶
- 掌握大模型应用开发基础理论
- 能够使用Prompt工程进行应用开发
- 完成2-3个小型实战项目
中期目标(3-6个月)¶
- 深入理解RAG系统和Agent开发
- 能够独立设计和实现大模型应用
- 完成1-2个中型实战项目
长期目标(6个月+)¶
- 掌握大模型前沿技术
- 具备解决复杂大模型应用问题的能力
- 完成1个大型实战项目
- 通过大厂面试
📅 详细学习计划¶
第一阶段:基础夯实(第1-3周)¶
第1周:大模型应用概述¶
学习内容: - 01-大模型应用概述.md - 大模型发展历程(1天) - 主流大模型介绍(2天) - 大模型应用场景(2天) - 环境搭建与第一个Demo(2天)
学习时间:每天3-4小时,总计20-25小时
第2周:Prompt工程¶
学习内容: - 02-Prompt工程.md - Prompt基础(2天) - Prompt设计技巧(2天) - Prompt优化方法(2天) - 实战:Prompt工程实践(1天)
学习时间:每天3-4小时,总计20-25小时
第3周:上下文学习¶
学习内容: - 03-上下文学习.md - 上下文学习原理(2天) - Few-shot Learning(2天) - Zero-shot Learning(2天) - 实战:上下文学习应用(1天)
学习时间:每天3-4小时,总计20-25小时
第二阶段:核心应用(第4-8周)¶
第4周:思维链与推理¶
学习内容: - 04-思维链与推理.md - 思维链概述(1天) - CoT技术(2天) - 推理优化(2天) - 实战:思维链应用(2天)
学习时间:每天3-4小时,总计20-25小时
第5周:RAG系统构建¶
学习内容: - 05-RAG系统构建.md - RAG概述(1天) - 文档检索(2天) - 知识库构建(2天) - 实战:RAG系统实现(2天)
学习时间:每天3-4小时,总计20-25小时
第6周:向量数据库¶
学习内容: - 06-向量数据库.md - 向量数据库概述(1天) - Embedding技术(2天) - 向量检索(2天) - 实战:向量数据库应用(2天)
学习时间:每天3-4小时,总计20-25小时
第7周:Agent开发基础¶
学习内容: - 07-Agent开发基础.md - Agent概述(1天) - Agent架构(2天) - Agent工具(2天) - 实战:简单Agent实现(2天)
学习时间:每天3-4小时,总计20-25小时
第8周:LangChain框架¶
学习内容: - 08-LangChain框架.md - LangChain概述(1天) - LangChain核心组件(2天) - LangChain应用开发(2天) - 实战:LangChain项目(2天)
学习时间:每天3-4小时,总计20-25小时
第三阶段:进阶技术(第9-12周)¶
第9周:大模型微调技术¶
学习内容: - 09-大模型微调技术.md - 微调概述(1天) - 全量微调(2天) - 参数高效微调(2天) - 实战:微调实践(2天)
学习时间:每天3-4小时,总计20-25小时
第10周:LoRA与QLoRA¶
学习内容: - 10-LoRA与QLoRA.md - LoRA原理(2天) - QLoRA技术(2天) - 微调实践(2天) - 实战:LoRA应用(1天)
学习时间:每天3-4小时,总计20-25小时
第11周:大模型部署¶
学习内容: - 11-大模型部署.md - 部署概述(1天) - 模型量化(2天) - 推理优化(2天) - 实战:模型部署(2天)
学习时间:每天3-4小时,总计20-25小时
第12周:推理优化¶
学习内容: - 12-推理优化.md - 推理优化概述(1天) - KV Cache(2天) - 批处理优化(2天) - 实战:推理优化实践(2天)
学习时间:每天3-4小时,总计20-25小时
第四阶段:前沿应用(第13-15周)¶
第13周:多模态应用¶
学习内容: - 13-多模态应用.md - 多模态概述(1天) - 图文理解(2天) - 多模态生成(2天) - 实战:多模态应用(2天)
学习时间:每天3-4小时,总计20-25小时
第14周:大模型安全与对齐¶
学习内容: - 14-大模型安全与对齐.md - 安全概述(1天) - 对齐技术(2天) - 安全防护(2天) - 实战:安全应用(2天)
学习时间:每天3-4小时,总计20-25小时
第15周:大模型应用案例¶
学习内容: - 15-大模型应用案例.md - 案例分析(2天) - 最佳实践(2天) - 项目实战(3天)
学习时间:每天3-4小时,总计20-25小时
第五阶段:实战项目(第16-20周)¶
第16-17周:项目1-RAG问答系统¶
学习内容: - 实战项目/01-RAG知识库问答系统.md - 项目需求分析(2天) - 知识库构建(3天) - RAG系统实现(4天) - 系统优化与部署(3天)
学习时间:每天4-5小时,总计48-60小时
第18-19周:项目2-AI Agent系统¶
学习内容: - 实战项目/02-AI Agent工作流.md - 项目需求分析(2天) - Agent设计(3天) - Agent实现(4天) - 系统集成与部署(3天)
学习时间:每天4-5小时,总计48-60小时
第20周:项目3-多模态应用¶
学习内容: - 实战项目/03-多模态应用.md - 项目需求分析(1天) - 多模态模型集成(2天) - 应用开发(3天) - 系统部署(2天)
学习时间:每天4-5小时,总计32-40小时
第六阶段:面试准备(第21-24周)¶
第21周:算法题库¶
学习内容: - 面试准备/README.md(算法题库部分) - 大模型算法题(2天) - 系统设计基础(2天) - 编程题(2天) - 刷题练习(1天)
学习时间:每天3-4小时,总计20-25小时
第22周:系统设计与项目经验¶
学习内容: - 面试准备/README.md(系统设计与项目经验部分) - 大模型系统设计(2天) - 项目经验梳理(2天) - 技术难点准备(2天) - 模拟面试(1天)
学习时间:每天3-4小时,总计20-25小时
第23-24周:大厂面试准备¶
学习内容: - 面试准备/README.md(大厂面试与行为面试部分) - 字节跳动面试题(2天) - 腾讯面试题(2天) - 阿里巴巴面试题(2天) - 百度面试题(2天) - 综合复习与模拟面试(4天)
学习时间:每天3-4小时,总计48-60小时
📊 学习进度跟踪¶
进度检查点¶
第3周末: - [ ] 完成基础理论学习 - [ ] 运行第一个大模型Demo - [ ] 完成Prompt工程实践
第8周末: - [ ] 理解RAG和Agent核心原理 - [ ] 完成RAG系统项目 - [ ] 完成Agent项目
第12周末: - [ ] 掌握微调和部署技术 - [ ] 完成微调实践 - [ ] 完成模型部署
第15周末: - [ ] 了解前沿技术 - [ ] 完成多模态应用 - [ ] 形成技术知识体系
第20周末: - [ ] 完成3个完整实战项目 - [ ] 具备独立开发能力 - [ ] 准备好面试
第24周末: - [ ] 完成所有面试准备 - [ ] 通过模拟面试 - [ ] 准备好求职
💡 学习方法建议¶
1. 理论学习¶
- 先理解后记忆:不要死记硬背,理解原理更重要
- 画图辅助:用图示帮助理解复杂概念
- 联系实际:将理论与实际应用联系起来
2. 代码实践¶
- 从零实现:关键算法要自己实现一遍
- 阅读源码:学习优秀开源项目的代码
- 调试技巧:掌握调试和问题排查方法
3. 项目开发¶
- 完整流程:从需求到部署完整实践
- 迭代优化:不断改进和优化
- 文档编写:养成良好的文档习惯
4. 面试准备¶
- 系统复习:定期复习核心知识
- 刷题练习:LeetCode、牛客网等
- 模拟面试:进行多次模拟面试
5. 持续学习¶
- 关注前沿:阅读最新论文和博客
- 参与社区:加入技术社区交流
- 分享输出:写博客、做分享
❓ 常见问题解答¶
Q1: 学习时间不够怎么办?¶
A: - 优先学习核心章节(01-08章) - 其他章节可以根据兴趣选择 - 重点掌握Prompt工程、RAG、Agent - 利用碎片时间学习
Q2: 没有GPU怎么办?¶
A: - 使用Google Colab免费GPU - 使用Kaggle Kernels - 使用学校/实验室资源 - 先学习理论知识,后期再实践
Q3: 数学基础薄弱怎么办?¶
A: - 边学边补,在实践中理解 - 推荐《深度学习》第2-4章 - 观看3Blue1Brown的数学视频 - 多做练习题巩固
Q4: 如何选择大模型?¶
A: - GPT系列:通用能力强,适合大多数场景 - Claude:长文本处理能力强 - 开源模型:成本可控,可私有部署 - 建议:根据需求选择合适模型
Q5: 实战项目太难怎么办?¶
A: - 从简单项目开始 - 参考开源项目,理解后再自己实现 - 分阶段完成,逐步增加难度 - 遇到问题及时求助
Q6: 如何准备大厂面试?¶
A: - 系统学习面试准备目录 - 多刷LeetCode相关题目 - 准备2-3个深度项目 - 进行多次模拟面试 - 了解目标公司和岗位
Q7: 学习过程中遇到困难怎么办?¶
A: - 查阅官方文档和教程 - 在Stack Overflow搜索 - 加入技术社区提问 - 向同学、导师请教 - 不要放弃,持续努力
Q8: 如何平衡学习和求职?¶
A: - 制定合理的学习计划 - 优先学习核心知识 - 边学习边准备面试 - 项目经验很重要 - 保持积极心态
🎥 视频教程链接¶
中文视频教程¶
B站推荐¶
💡 以下为推荐的UP主和搜索关键词,请在B站直接搜索获取最新内容。
推荐UP主(在B站搜索其名称即可找到): - 李沐 - 论文精读系列(RAG、Agent等前沿论文) - 跟李沐学AI - 大模型应用相关论文精读
推荐搜索关键词: - "Prompt工程 实战"、"RAG 系统 构建" - "LangChain 教程"、"Agent 开发 入门" - "大模型 微调 LoRA"、"向量数据库 教程" - "LLM 应用开发 实战"
国内MOOC平台¶
💡 以下为推荐平台,请在平台内搜索相关课程名称。
英文视频教程¶
YouTube优质频道¶
- LangChain官方 - LangChain官方教程
- OpenAI Developers - OpenAI官方开发教程
- Hugging Face - Hugging Face NLP课程
- DeepLearning.AI - Andrew Ng的深度学习课程
- AssemblyAI - NLP和语音识别教程
Coursera课程¶
- Generative AI with Large Language Models - 大模型生成式AI
- ChatGPT Prompt Engineering for Developers - 提示词工程
- Natural Language Processing Specialization - NLP专项课程
Udemy课程¶
- LangChain: Develop LLM powered applications with LangChain - LangChain应用开发
- Complete Guide to Building RAG Applications - RAG系统完整指南
- Prompt Engineering for ChatGPT - ChatGPT提示词工程
edX课程¶
- MIT 6.S191: Introduction to Deep Learning - MIT深度学习入门
- Harvard CS50's Introduction to Artificial Intelligence with Python - 哈佛AI入门
💻 在线练习平台¶
LLM应用开发实践平台¶
- LangChain官方文档 - LangChain框架学习和实践
- LlamaIndex官方文档 - RAG系统构建实践
- Hugging Face Course - NLP和Transformers实践课程
- Google Colab - 免费GPU环境,适合LLM应用实验
LLM应用开发课程¶
- Coursera - 搜索"Generative AI with LLMs"、"Prompt Engineering"等课程
- Udemy - 搜索"LangChain"、"RAG Applications"等课程
- Fast.ai - 实用导向的深度学习和NLP课程
- edX - MIT/Stanford AI免费课程
📚 推荐学习资源¶
在线课程¶
- CS224N - Stanford
- Deep Learning Specialization - Coursera
- Prompt Engineering Guide - OpenAI
书籍¶
- 《深度学习》- Ian Goodfellow
- 《注意力机制》- Vaswani et al.
- 《大模型应用开发实战》
论文¶
- arXiv cs.CL
- Papers with Code
- Hugging Face Papers
开源项目¶
- LangChain
- LlamaIndex
- AutoGPT
- Hugging Face Transformers
🚀 开始学习¶
现在你已经了解了完整的学习路径,让我们开始大模型应用开发的学习之旅吧!
第一步:阅读01-大模型应用概述.md
记住:学习是一个持续的过程,保持耐心和坚持,你一定能够成功!
祝学习顺利,早日实现大厂梦想! 💪
📚 参考文献¶
核心论文¶
Prompt工程¶
- Language Models are Few-Shot Learners - Brown et al., 2020
-
GPT-3论文,展示了大模型的few-shot能力
-
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models - Wei et al., 2022
-
思维链(CoT)提示方法
-
Large Language Models Are Zero-Shot Reasoners - Kojima et al., 2022
-
Zero-shot-CoT方法
-
Tree of Thoughts: Deliberate Problem Solving with Large Language Models - Yao et al., 2023
- 思维树(ToT)框架
RAG系统¶
- Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks - Lewis et al., 2020
-
RAG开山之作
-
Dense Passage Retrieval for Open-Domain Question Answering - Karpukhin et al., 2020
-
DPR,密集检索方法
-
Improving Dense Retrieval with Contrastive Learning - Qu et al., 2022
-
对比学习改进检索
-
HyDE: Precise Answer Generation via Retrieval from Hypothetical Document Embeddings - Gao et al., 2022
- 假设文档嵌入方法
Agent开发¶
- ReAct: Synergizing Reasoning and Acting in Language Models - Yao et al., 2022
-
ReAct框架,推理与行动结合
-
Reflexion: Language Agents with Verbal Reinforcement Learning - Shinn et al., 2023
- 反思机制
-
AutoGPT: An Autonomous GPT-4 Agent - Significant Gravitas, 2023
- 自主Agent框架
-
BabyAGI: A Task-Driven Autonomous Agent - Yohei Nakajima, 2023
- 任务驱动的自主Agent
微调与部署¶
-
LoRA: Low-Rank Adaptation of Large Language Models - Hu et al., 2021
- 低秩适配技术
-
QLoRA: Efficient Finetuning of Quantized LLMs - Dettmers et al., 2023
- 量化感知的LoRA
-
vLLM: Easy, Fast, and Cheap LLM Serving - Kwon et al., 2023
- 高效推理服务
技术博客¶
中文博客¶
- LangChain中文文档 - LangChain官方中文文档
- LlamaIndex中文文档 - LlamaIndex中文文档
- Hugging Face 中文博客 - Hugging Face官方中文博客
- 深度学习自然语言处理 - NLP技术分享
- 机器之心 - AI行业媒体
英文博客¶
- LangChain Blog - LangChain官方博客
- LlamaIndex Blog - LlamaIndex官方博客
- OpenAI Blog - OpenAI官方博客
- Anthropic Blog - Anthropic研究博客
- Jay Alammar's Blog - 可视化理解技术
开源项目¶
应用框架¶
- LangChain - LLM应用开发框架
- LlamaIndex - 数据框架,构建LLM应用
- Semantic Kernel - 微软LLM应用SDK
- Haystack - NLP应用框架
- AutoGen - 微软多Agent框架
RAG系统¶
- LangChain RAG - LangChain RAG实现
- LlamaIndex RAG - LlamaIndex RAG
- Verba - Weaviate的RAG演示
- PrivateGPT - 私有化GPT
- GPT-RAG - Amazon的RAG框架
Agent框架¶
- AutoGPT - 自主AI智能体
- BabyAGI - 任务驱动Agent
- CrewAI - 多Agent协作框架
- LangChain Agents - LangChain Agent
- MetaGPT - 多角色Agent框架
向量数据库¶
参考书籍¶
中文书籍¶
- 《大模型应用开发实战》- 机械工业出版社
-
大模型应用开发实践指南
-
《LangChain实战:构建大语言模型应用》- 电子工业出版社
-
LangChain框架实战教程
-
《自然语言处理综论》- Daniel Jurafsky、James H. Martin 著,电子工业出版社
-
NLP领域的经典教材
-
《深度学习》- Ian Goodfellow、Yoshua Bengio、Aaron Courville 著,人民邮电出版社
-
深度学习领域的"圣经"
-
《动手学深度学习》- 李沐、阿斯顿·张 著,人民邮电出版社
-
实践导向的深度学习教程
-
《Python深度学习》- François Chollet 著,人民邮电出版社
-
Keras作者撰写的深度学习实践指南
-
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》- Aurélien Géron 著,机械工业出版社
-
机器学习实践指南
-
《强化学习》- Richard S. Sutton、Andrew G. Barto 著,电子工业出版社
- 强化学习领域的奠基之作
英文书籍¶
- "Natural Language Processing with Transformers" - Lewis Tunstall, Leandro von Werra, Thomas Wolf
-
O'Reilly,Transformer实战指南
-
"Designing Machine Learning Systems" - Chip Huyen
-
O'Reilly,机器学习系统设计
-
"Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow" - Aurélien Géron
-
O'Reilly,机器学习实践指南
-
"Building AI Applications with LangChain" - Denis Rothman
-
Packt,LangChain应用开发
-
"Prompt Engineering for Generative AI" - James Phoenix
-
Packt,提示词工程
-
"Large Language Models: Concepts, Architecture, and Applications" - Soma Halder
-
Packt,大模型应用
-
"Reinforcement Learning: An Introduction" - Richard S. Sutton, Andrew G. Barto
-
MIT Press,强化学习奠基之作
-
"Python Machine Learning" - Sebastian Raschka, Vahid Mirjalili
- Packt,Python机器学习实践
在线课程¶
中文课程¶
💡 中文视频教程推荐请参见上方 视频教程链接 章节。
英文课程¶
- LangChain for LLM Application Development (Udemy) - LangChain应用开发
- Complete Guide to Building RAG Applications (Udemy) - RAG系统完整指南
- Prompt Engineering for ChatGPT (Udemy) - ChatGPT提示词工程
- Generative AI with Large Language Models (Coursera) - 大模型生成式AI
- ChatGPT Prompt Engineering for Developers (Coursera) - 提示词工程
社区资源¶
中文社区¶
- LangChain中文社区 - LangChain中文文档
- Hugging Face中文社区 - 模型和数据集分享
- 机器之心 - AI行业媒体
- 量子位 - AI前沿资讯
- Datawhale - 开源学习社区
英文社区¶
- LangChain Discord - LangChain社区
- LlamaIndex Discord - LlamaIndex社区
- OpenAI Community - OpenAI社区
- Hugging Face Forum - Hugging Face讨论区
- Reddit r/LangChain - LangChain讨论
论坛与问答¶
- Stack Overflow LangChain - LangChain技术问答
- Stack Overflow RAG - RAG技术问答
- GitHub Discussions - LangChain讨论
- Hugging Face Forum - Hugging Face讨论区
邮件列表与Slack¶
- LangChain Discord - LangChain社区
- LlamaIndex Discord - LlamaIndex社区
- OpenAI Community - OpenAI社区
最后更新日期:2026-02-12 适用版本:LLM应用指南 v2026