论文写作指南¶
🎯 学习目标¶
完成本章学习后,你将能够: - 掌握学术论文写作的核心原则和逻辑框架 - 熟练写作论文各个部分(Title, Abstract, Introduction, Method, Experiments, Conclusion) - 避免学术写作中的常见错误 - 制作规范的学术图表和参考文献 - 理解论文投稿的完整流程 - 了解AI方向主要学术会议的级别和截稿时间
一、学术论文写作的核心原则¶
学术论文不是文学创作,其本质是说服审稿人和读者你的工作是正确且有价值的。遵循以下四个核心原则:
1.1 清晰(Clarity)¶
- 每个段落只传达一个核心观点
- 使用简单直接的句式,避免复杂长句
- 定义所有符号和术语,首次出现时给出定义
- 论文的逻辑链条应该让读者无障碍地跟随
1.2 准确(Accuracy)¶
- 每一个学术声明都要有依据(引用或实验证据)
- 公式、数据、图表必须经过仔细核实
- 不夸大结果,不做没有证据支撑的claim
- 引用的内容必须准确反映原文的意思
1.3 简洁(Conciseness)¶
- 删除冗余的词语和句子("it is worth noting that..." → 直接说)
- 不重复已经说过的内容
- 用图表代替大段文字描述
- 在表达清晰的前提下,越短越好
1.4 逻辑(Logic)¶
- 论文整体遵循"是什么→为什么→怎么做→做得怎么样"的逻辑
- 段落之间要有清晰的逻辑链条(因果、递进、转折)
- 每个claim都要有对应的evidence
- 结论要与实验结果一致,不能超出实验支撑的范围
💡 提示:初稿完成后,至少修改3遍以上。第一遍关注逻辑结构,第二遍关注语言表达,第三遍关注格式细节。
二、论文各部分写作技巧¶
2.1 Title:如何起一个好标题¶
标题是论文的第一印象,决定了读者是否会打开你的论文。
好标题的特征: - 准确反映论文内容 - 包含关键词(便于搜索检索) - 简洁有力(一般不超过15个词) - 有一定的吸引力
标题模式:
| 模式 | 示例 |
|---|---|
| 方法名: 功能描述 | BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding |
| 功能/效果描述 | Attention Is All You Need |
| 问题+方案 | Scaling Language Models: Methods, Analysis & Insights from Training Gopher |
| 疑问句 | Are Transformers Effective for Time Series Forecasting? |
避免: - ❌ 标题过于宽泛:"A Study on Deep Learning" - ❌ 标题过于冗长:超过20个词 - ❌ 标题不准确:与论文实际内容不符
2.2 Abstract:结构化摘要¶
摘要是论文最重要的部分之一——很多读者只读摘要。好的摘要应该在200词以内(具体看会议/期刊要求)包含以下五个要素:
结构化摘要 = 背景 + 问题 + 方法 + 结果 + 意义
(1) 背景(1-2句):简述研究领域的大背景
(2) 问题(1-2句):指出已有方法的不足或要解决的问题
(3) 方法(2-3句):概述你的方法的核心idea
(4) 结果(1-2句):简述主要实验结果,用数据说话
(5) 意义(0-1句):指出工作的意义或实用价值(可选)
示例(模拟):
Large language models (LLMs) have achieved remarkable success across various NLP tasks. [背景] However, they often struggle with hallucination, generating plausible but factually incorrect content. [问题] In this paper, we propose FactGuard, a retrieval-augmented verification framework that detects and corrects hallucinated statements in LLM outputs by cross-referencing external knowledge bases in real time. [方法] Extensive experiments on three benchmarks show that FactGuard reduces hallucination rates by 47% while maintaining 98% of the original response quality. [结果] Our framework is lightweight and can be integrated into any LLM deployment pipeline. [意义]
⚠️ 注意:Abstract中不要包含引用,不要使用缩写(除非极其常用如NLP、LLM),不要出现"本文"类主语不明的表述。
2.3 Introduction:漏斗模型¶
Introduction是论文的导读章节,决定了审稿人对你工作的第一印象。经典的Introduction遵循"漏斗模型"——从宽泛到具体:
┌─────────────────────────────────┐ ← 大背景(宽泛)
│ Para 1: 领域大背景 │
│ "XXX has attracted growing..." │
├─────────────────────────────────┤
│ Para 2-3: 具体问题 │
│ "However, existing methods..." │
│ "The key challenge is..." │
├─────────────────────────────────┤
│ Para 4: 已有方法及其不足 │
│ "Prior works [1,2,3]..." │
│ "However, they suffer from..." │
├─────────────────────────────────┤
│ Para 5: 本文贡献 │
│ "In this paper, we propose..." │
│ "Our contributions include:" │
│ • Contribution 1 │
│ • Contribution 2 │
│ • Contribution 3 │
├─────────────────────────────────┤
│ Para 6: 论文组织(可选) │
│ "The rest of this paper is..." │
└─────────────────────────────────┘ ← 本文具体工作(聚焦)
写作要点:
- 第一段:用1-2个强有力的句子引起兴趣,引出大背景
- 问题段:自然过渡到具体问题,用"However"、"Despite"等转折词
- 已有方法:客观、公正地总结已有方法,指出它们的不足(不要贬低他人工作)
- 贡献列表:通常用bullet points列出3-4条具体贡献
- 论文结构:简述后续各节的内容安排
💡 提示:贡献列表的写作技巧——每条贡献都要是具体的、可验证的。避免写"We propose a novel method..."这种空泛的描述,而应该写"We propose X that addresses Y by Z"。
2.4 Related Work:定位与对比¶
Related Work的目的不是"证明你读了很多论文",而是让读者理解你的工作在已有研究版图中的位置。
两种组织方式:
| 方式 | 适用情况 | 结构 |
|---|---|---|
| 分类综述 | 相关工作可以明确分类 | 按方法类型或问题类型分小节 |
| 时间线综述 | 领域发展脉络清晰 | 按时间顺序梳理发展历程 |
写作原则: - 对每个引用的工作,说明它做了什么以及与你的区别 - 最后要有一段总结,明确指出你的方法与已有方法的本质区别 - 不要遗漏重要的相关工作(这是审稿人最敏感的点) - 保持客观,不要贬低他人的工作
2.5 Methodology:方法描述¶
方法部分是论文的核心,需要详细、准确地描述你的方法,使读者能够复现你的工作。
写作框架:
3. Methodology
3.1 Problem Formulation(问题定义)
- 形式化定义问题(输入、输出、目标)
- 必要的符号定义
3.2 Overview(方法概述)
- 用一段文字+一张框架图概述整体方法
3.3 Component A(组件A详述)
- 具体方法描述
- 关键公式推导
3.4 Component B(组件B详述)
- ...
3.5 Training/Optimization(训练/优化)
- 损失函数
- 训练策略
Level of Detail: - 必须详细:你的创新点和核心方法必须描述得足够详细,让人能够复现 - 可以简略:标准的、已有的方法可以简述并引用原始论文 - 使用公式:关键步骤用数学公式表达,比文字描述更精确 - 使用图示:框架图(Architecture Diagram)能极大提高可读性
⚠️ 注意:方法部分最常见的问题是"隐含假设"——你认为读者知道的东西,读者可能不知道。写完后找一个不了解你工作的同学读一遍,看是否能理解。
2.6 Experiments:实验验证¶
实验部分要回答一个核心问题:你的方法是否有效?有多好?
标准结构:
4. Experiments
4.1 Experimental Setup
- Datasets(数据集描述和统计信息)
- Baselines(对比方法列表和关键设置)
- Evaluation Metrics(评估指标说明)
- Implementation Details(超参数、训练细节)
4.2 Main Results
- 主结果表格(与Baseline的比较)
- 结果分析和讨论
4.3 Ablation Study
- 消融实验表格
- 各组件贡献分析
4.4 Analysis(进一步分析)
- 参数敏感性分析
- 可视化分析
- Case Study
- 效率分析(时间/空间复杂度)
表格规范:
Table 1: Performance comparison on XXX dataset.
Bold indicates the best results. Underline indicates the second best.
| Method | Precision | Recall | F1-Score |
|------------|-----------|--------|----------|
| Baseline_1 | 85.2 | 82.1 | 83.6 |
| Baseline_2 | 87.5 | 84.3 | 85.9 |
| SOTA | 89.1 | _86.7_ | _87.9_ |
| Ours | **91.3** | **88.5** | **89.9** |
结果分析要点: - 不仅报告数字,更要分析为什么你的方法更好 - 讨论在哪些场景下你的方法优势明显,在哪些场景下优势不大 - 如果某些结果不如预期,诚实说明并分析原因
2.7 Conclusion:总结与展望¶
Conclusion不仅仅是Method和Experiments的重复,而是要站在更高的视角总结工作的意义。
结构:
5. Conclusion
- 一段总结:重述问题和方法(1-2句),概括主要发现
- 局限性(Limitations):坦诚讨论方法的不足
- 未来工作(Future Work):指出潜在的改进方向
💡 提示:很多审稿人喜欢看到作者诚实地讨论Limitations。这不是示弱,而是展示你对自己工作有深刻的理解。
三、学术写作常见错误¶
3.1 中式英语(Chinglish)¶
| 中式英语 | 地道英语 |
|---|---|
| With the development of deep learning... | Recent advances in deep learning... |
| In recent years, more and more... | A growing body of work... |
| We can clearly see that... | Table 1 shows that... / As shown in Table 1, ... |
| It is worth mentioning that... | Notably, ... / It is notable that... |
| Has achieved a good result | Achieves competitive/superior performance |
3.2 逻辑不清¶
- 症状:段落之间跳跃,读者无法理解前后关系
- 解决:使用过渡词(However, Moreover, Specifically, In contrast, To address this)
- 检查:每个段落的首句是否能让读者理解本段与上一段的关系
3.3 过度Claim¶
- ❌ "Our method significantly outperforms all existing methods"(除非你真的在所有指标上都显著优于所有方法)
- ✅ "Our method achieves state-of-the-art results on X and Y benchmarks"
- ❌ "This is the first work that..."(很危险,除非你非常确定)
- ✅ "To the best of our knowledge, this is among the first works that..."
3.4 其他常见问题¶
| 问题 | 说明 |
|---|---|
| 时态混乱 | 一般用现在时描述公知事实和你的方法,过去时描述已有工作 |
| 人称不一致 | 统一使用"we"或被动语态,不要混用 |
| 图表引用缺失 | 正文中必须引用每一个图表(As shown in Figure 1...) |
| 缩写未定义 | 首次出现的缩写必须给出全称 |
四、图表制作规范¶
4.1 图表制作工具¶
| 工具 | 适用场景 | 优点 |
|---|---|---|
| matplotlib | 实验结果图、折线图、柱状图 | Python生态,可编程 |
| TikZ | 模型架构图、流程图 | 与LaTeX完美结合,矢量图 |
| draw.io | 框架图、流程图 | 免费在线工具,简单易用 |
| Excalidraw | 手绘风格图 | 清新风格,适合博客和演示 |
4.2 配色方案¶
学术论文推荐使用专业的配色方案:
# 推荐学术配色 (来自colorbrewer2.org)
colors_qualitative = ['#e41a1c', '#377eb8', '#4daf4a', '#984ea3', '#ff7f00']
colors_sequential = ['#f7fcfd', '#e5f5f9', '#ccece6', '#99d8c9', '#41ae76']
# matplotlib 学术风格设置
import matplotlib.pyplot as plt
plt.style.use('seaborn-v0_8-whitegrid') # 学术论文风格
plt.rcParams['font.family'] = 'serif'
plt.rcParams['font.size'] = 12
plt.rcParams['figure.dpi'] = 300 # 高分辨率
4.3 表格格式¶
- 使用三线表(只有顶线、标题线、底线),不要用满格线
- 在LaTeX中使用
booktabs包(\toprule,\midrule,\bottomrule) - 加粗最佳结果,下划线表示次佳
- 表题在表格上方,图题在图片下方
五、参考文献格式¶
5.1 BibTeX管理¶
使用BibTeX管理参考文献是学术写作的标准做法。
@inproceedings{vaswani2017attention,
title = {Attention is All You Need},
author = {Vaswani, Ashish and Shazeer, Noam and Parmar, Niki and
Uszkoreit, Jakob and Jones, Llion and Gomez, Aidan N and
Kaiser, {\L}ukasz and Polosukhin, Illia},
booktitle = {Advances in Neural Information Processing Systems (NeurIPS)},
year = {2017}
}
5.2 常见引用格式¶
| 格式 | 领域 | 示例 |
|---|---|---|
| IEEE | 工程/计算机 | [1] A. Vaswani et al., "Attention is all you need," ... |
| ACM | 计算机 | Vaswani et al. [2017] |
| APA | 社会科学 | Vaswani, A., et al. (2017). Attention is all you need. |
💡 提示:从Google Scholar获取BibTeX条目时,记得检查并补全信息(会议名、页码等)。不同会议对引用格式有不同要求,务必阅读会议的Author Guidelines。
六、论文投稿流程¶
6.1 完整投稿流程¶
选择目标会议/期刊 → 按格式要求排版 → 内部审阅 → 提交论文
↓ ↓
研读往年论文 等待审稿
↓ ↓
判断工作是否匹配 收到审稿意见
↓
┌── Accept → Camera-ready
├── Revise → Rebuttal/修改
└── Reject → 修改后投其他
6.2 选择会议/期刊¶
考虑因素: - 匹配度:你的工作是否符合会议/期刊的scope - 级别:A*/A/B类会议的选择 - 截稿时间:是否能在deadline前完成 - 审稿周期:会议通常2-3个月,期刊可能数月到1年
6.3 Rebuttal撰写¶
收到审稿意见后,很多会议允许提交rebuttal(反驳/回应)。
Rebuttal写作原则: - 感谢:首先感谢审稿人的意见 - 逐条回应:对每个concern都给出具体回应 - 提供证据:如果可能,补充实验来回应质疑 - 保持尊重:即使审稿人误解了你的工作,也要礼貌回应 - 承认不足:如果审稿人指出了真正的问题,坦诚承认并说明如何改进
6.4 AI方向主要会议¶
| 会议 | 级别 | 领域 | 大致截稿时间 | 通知时间 | 会议时间 |
|---|---|---|---|---|---|
| NeurIPS | A* | 机器学习 | 5月 | 9月 | 12月 |
| ICML | A* | 机器学习 | 1月 | 5月 | 7月 |
| ICLR | A* | 表示学习 | 10月 | 1月 | 5月 |
| CVPR | A* | 计算机视觉 | 11月 | 3月 | 6月 |
| ICCV | A* | 计算机视觉 | 3月 | 7月 | 10月 |
| ECCV | A* | 计算机视觉 | 3月 | 7月 | 10月 |
| ACL | A* | NLP | 1月 | 5月 | 7月 |
| EMNLP | A | NLP | 6月 | 9月 | 11月 |
| AAAI | A | 人工智能 | 8月 | 12月 | 2月 |
| IJCAI | A | 人工智能 | 1月 | 4月 | 8月 |
| KDD | A* | 数据挖掘 | 2月 | 5月 | 8月 |
| SIGIR | A | 信息检索 | 1月 | 4月 | 7月 |
| WWW | A* | Web技术 | 10月 | 1月 | 5月 |
⚠️ 注意:以上时间为大致参考,每年的具体截稿时间可能有变动。请务必查阅当年的Call for Papers获取准确日期。推荐使用 https://aideadlin.es/ 追踪所有AI会议的deadline。
📝 本章小结¶
| 知识点 | 核心要点 |
|---|---|
| 写作原则 | 清晰、准确、简洁、逻辑 |
| Title | 准确+关键词+简洁+吸引力 |
| Abstract | 背景→问题→方法→结果→意义,200词内 |
| Introduction | 漏斗模型,贡献列表要具体 |
| Method | 核心方法详述,标准方法简述 |
| Experiments | 主结果+消融+分析,表格规范 |
| Conclusion | 总结+局限性+未来工作 |
| 投稿流程 | 选会议→排版→提交→审稿→rebuttal→camera-ready |
🔗 延伸阅读¶
- Simon Peyton Jones, "How to Write a Great Research Paper"(YouTube演讲)
- Manchester Academic Phrasebank:https://www.phrasebank.manchester.ac.uk/
- AI Deadlines:https://aideadlin.es/
- 《科研论文写作新手入门》—Science杂志系列