准备写论文,论文大纲和数据搞定

This commit is contained in:
sinlatansen
2026-02-25 20:27:46 +08:00
parent 5ee1a16574
commit 2561314174
17 changed files with 5168 additions and 0 deletions

View File

@@ -0,0 +1,364 @@
好,这一步的目标已经从 **“继续做系统”** 转为:
```text
冻结仿真平台 → 产出论文级结果 → 图表化 → 可发表材料
```
下面给你一个**专门面向论文产出**的执行大纲(给执行 AI 用)。重点不是再改算法,而是把现有 Phase-3.5 数据变成 **审稿人可接受的 evidence**
---
# `paper_output_plan.md`
---
# 1. 目标Objective
将 Phase-3.5 仿真平台输出转换为:
* 可复现实验结果
* 标准论文图表
* 对比表格
* 统计显著性验证
* 可直接插入论文的 figures/tables
**禁止修改算法逻辑**,只允许:
* 数据采集增强
* 实验批量运行
* 可视化
* 统计分析
---
# 2. 输出目录结构(必须固定)
```
docs/
└── paper/
├── figures/
│ ├── fig1_topology.png
│ ├── fig2_pdr_vs_airtime.png
│ ├── fig3_tx_efficiency.png
│ ├── fig4_scalability.png
│ └── fig5_tradeoff_curve.png
├── tables/
│ ├── table1_algorithm_compare.csv
│ ├── table2_scaling_results.csv
│ └── table3_efficiency_metrics.csv
├── raw_data/
└── scripts/
├── generate_figures.py
└── aggregate_results.py
```
---
# 3. 实验冻结规则CRITICAL
在 config 中增加:
```
EXPERIMENT_VERSION = "phase3_5_frozen"
```
要求:
* RANDOM_SEED 固定
* 参数写入 metadata.json
* 每次实验自动记录:
* git commit hash
* 时间
* 参数集
否则论文不可复现。
---
# 4. 必须生成的论文图(核心部分)
## Figure 1 — Network Topology
目的:
证明不是 toy example。
内容:
* 节点位置 scatter
* sink 标记
* 典型 routing treegradient
输出:
```
fig1_topology.png
```
---
## Figure 2 — PDR vs Airtime最重要
X轴
```
airtime_usage (%)
```
Y轴
```
PDR (%)
```
曲线:
* Gradient
* Flooding
* Random
意义:
证明:
```
Flooding = resource inefficient
```
这是整篇论文核心图。
---
## Figure 3 — Energy Efficiency
定义:
```
TX per Success
```
柱状图:
```
algorithm → TX/success
```
审稿人关注点:
LPWAN energy cost。
---
## Figure 4 — Scalability Test
扫描:
```
node_count = [6, 9, 12, 15, 18, 24]
```
Y轴
* PDR
* Airtime双图
目标:
证明算法随规模变化趋势。
---
## Figure 5 — Tradeoff Frontier论文加分图
绘制:
```
(PDR, Airtime)
```
散点:
每个实验配置一个点。
形成:
```
Pareto frontier
```
这张图非常“论文感”。
---
# 5. 必须生成的表格
---
## Table 1 — Algorithm Comparison主表
| Algorithm | PDR | Airtime | Total TX | TX/Success |
| --------- | --- | ------- | -------- | ---------- |
来自 Phase-3.5。
---
## Table 2 — Scaling Result
| Nodes | Gradient PDR | Flooding PDR | Random PDR |
| ----- | ------------ | ------------ | ---------- |
---
## Table 3 — Efficiency Gain
计算:
```
Efficiency Gain =
(TX_flooding - TX_gradient) / TX_flooding
```
展示资源节省比例。
---
# 6. 实验批量运行规范
新增:
```
python run_experiments.py --paper
```
执行:
```
for seed in [1..20]:
run experiment
```
输出:
```
mean
std
95% CI
```
论文必须有误差条。
---
# 7. 统计要求(很多人忽略)
每个指标输出:
```
mean ± std
```
并计算:
```
t-test(gradient, flooding)
```
输出:
```
p-value
```
目标:
```
p < 0.05
```
否则结论不够强。
---
# 8. 自动绘图规范
统一:
* matplotlib
* serif 字体
* 单色可打印
* 无背景网格
* dpi ≥ 300
尺寸:
```
3.5 inch (single column)
7 inch (double column)
```
---
# 9. 一键论文数据生成
新增入口:
```
python generate_paper_results.py
```
流程:
```
run experiments
→ aggregate
→ statistics
→ generate tables
→ generate figures
```
输出全部 paper assets。
---
# 10. 自测标准执行AI必须验证
生成后检查:
* [ ] figures ≥ 300dpi
* [ ] 所有图可单独理解
* [ ] table 数值与 raw_data 一致
* [ ] 重跑结果误差 <5%
* [ ] seed 改变趋势不变
---
# 11. 最终产物(你将得到)
完成后你会拥有:
```
✔ 5 张论文核心图
✔ 3 个结果表
✔ 可复现实验脚本
✔ 冻结baseline数据
```
这已经足够支撑:
* conference short paper
* systems workshop
* embedded networking paper
---
# 下一步(论文视角)
你接下来不需要工程决策,只需要三件事:
1.**大量 seeds**
2. 生成 **tradeoff 图**
3.**Method + Evaluation**

View File

@@ -0,0 +1,416 @@
下面直接给**论文产出阶段Post-Phase-3.5)操作流程**。
目标不是继续开发系统,而是把**已有平台 → 可发表实验结果**。
你现在的系统已经满足论文最低条件:
* ✅ 可复现实验seed
* ✅ baselinegradient / flooding / random
* ✅ 多指标PDR + airtime + TX cost
* ✅ 自动实验 runner
接下来只做 **科研标准三件事**
---
# 一、跑大量 seeds统计显著性
## 为什么必须做
现在结果:
```
PDR ≈ 18%
```
LoRa + 随机信道 → **方差极大**
单次结果 = 不可发表。
论文要求:
> expectation over randomness
即:
[
Result = E_{seed}[metric]
]
---
## 目标规模(直接照做)
| 项目 | 建议值 |
| --------- | ---------- |
| seeds 数量 | **3050** |
| 每 seed 时长 | 100s保持一致 |
| topology | 固定 |
| traffic | 固定 |
| 唯一变量 | RNG seed |
---
## 修改 runner核心思想
你已经有:
```
run_experiments.py
```
现在只加一层:
```python
for seed in range(50):
config.RANDOM_SEED = seed
run_single_experiment(...)
```
输出结构:
```
results/
gradient/
seed_0.json
seed_1.json
...
flooding/
random/
```
---
## 每个 json 至少包含
```json
{
"pdr": 0.187,
"airtime": 0.368,
"tx_total": 217,
"tx_per_success": 36.1
}
```
---
## 然后做统计汇总
计算:
```
mean
std
95% CI
```
公式:
[
CI = 1.96 \cdot \frac{\sigma}{\sqrt{N}}
]
---
# 二、生成 Tradeoff 图(论文核心)
这是**最关键步骤**。
论文 reviewers 不看日志,只看图。
---
## 图 1必须PDR vs Airtime
### 含义
证明:
> flooding 高 PDR 是用 airtime 换来的
---
### 横纵轴
```
x: airtime_usage (%)
y: PDR (%)
```
每个算法一个点(带 error bar
---
### Python 示例
```python
plt.errorbar(
airtime_mean,
pdr_mean,
xerr=airtime_ci,
yerr=pdr_ci,
fmt='o',
label='gradient'
)
```
---
### 论文意义(非常重要)
这是:
> efficiency frontier
审稿人一眼能理解贡献。
---
## 图 2必须TX Cost vs PDR
```
x: tx_per_success
y: PDR
```
解释:
```
能量效率 ↔ 可靠性 tradeoff
```
---
## 图 3强烈建议Airtime Budget Curve
固定 airtime 上限:
```
10%
20%
30%
...
```
看谁 PDR 更高。
这属于:
> fair resource comparison
非常论文化。
---
## 输出格式
保存:
```
figures/
pdr_vs_airtime.pdf
pdr_vs_cost.pdf
```
⚠️ 必须 PDF矢量图
---
# 三、写 Method + Evaluation论文主体
你现在不要写 Introduction。
只写两章:
```
III. Method
IV. Evaluation
```
---
## (1) Method 章节结构(直接按这个写)
### A. Network Model
描述:
* N nodes
* single gateway
* LoRa PHY abstraction
* collision model
不用写代码细节。
---
### B. Routing Algorithms
三个 subsection
#### 1. Gradient Routing
写:
* hello dissemination
* distance metric
* next-hop selection
给一个公式:
[
Cost_i = w_1 RSSI + w_2 HopCount
]
(即使当前权重简单也可以)
---
#### 2. Flooding (Baseline)
说明:
```
each node rebroadcasts once
```
强调:
> upper-bound reliability baseline
---
#### 3. Random Forwarding
说明:
```
random neighbor selection
```
作为 lower baseline。
---
### C. Evaluation Metrics你 Phase-3.5 的贡献)
定义:
#### Packet Delivery Ratio
[
PDR = \frac{received}{generated}
]
#### Airtime Usage
[
A = \frac{\sum TX_time}{simulation_time}
]
#### Transmission Cost
[
C = \frac{total_tx}{successful_packets}
]
这一节其实已经是论文贡献点。
---
## (2) Evaluation 章节结构
### A. Experimental Setup
写:
| 参数 | 值 |
| -------- | ----- |
| Nodes | 12 |
| Area | 800 m |
| Duration | 100 s |
| Seeds | 50 |
---
### B. Reliability Comparison
放表格:
| Algo | PDR | CI |
| ---- | --- | -- |
---
### C. Efficiency Tradeoff核心
插入:
* PDR vs Airtime 图
写一句关键论文句式:
> Gradient achieves comparable reliability while consuming significantly less channel airtime.
---
### D. Discussion
直接写你已经发现的:
```
Flooding improves reliability by saturating the channel rather than improving routing efficiency.
```
这句话就是论文卖点。
---
# 四、你接下来真实的 TODO最终版
直接复制给执行 AI
```markdown
# Paper Production TODO
## Phase-Paper-1: Statistical Experiments
- [ ] run 50 seeds per algorithm
- [ ] save per-seed JSON results
- [ ] compute mean/std/95%CI
## Phase-Paper-2: Figure Generation
- [ ] plot PDR vs Airtime (error bars)
- [ ] plot PDR vs TX_cost
- [ ] export PDF figures
## Phase-Paper-3: Method Section
- [ ] network model description
- [ ] routing algorithm definitions
- [ ] metric formalization
## Phase-Paper-4: Evaluation Section
- [ ] experiment setup table
- [ ] comparison tables
- [ ] tradeoff analysis text
```
---
# 五、一个关键判断(你现在的位置)
你已经从:
```
工程实现阶段
```
进入:
```
科研结果生产阶段
```
后续成功与否 **不再取决于算法**,而取决于:
```
统计严谨性 + 图表达能力
```