# L23303 prompts.md ↔ chunks/L23303.txt 行號對照（output3 版）

本文件記錄 `output3/L23303_模型訓練評估與驗證/prompts.md` 中每一頁 prompt 對應到 `chunks/L23303.txt` 的行號範圍。

## output3 設計原則

1. **章節命名與切頁嚴格沿用 chunks 原文 `#` heading**，每頁 1 對 1 對應一個原始章節（含節導讀 + 各 `（X）` 子小節），不重新命名、不合併、不拆分、不跳過。
2. **子小節 `# （X）...` 標題前綴父章節編號**，提升可讀性，但主詞不動（例：`# （1）資料分割與準備` → `2.（1）資料分割與準備`）。
3. **章節導讀頁獨立成頁**，即使原文僅 1–3 行，仍以「指向子小節入口」設計撐版面。
4. **每頁標註對應 chunks 行號**，所有頁區間連續無重疊。
5. **教材原詞清單從 chunks 原文抓**：括號中英對照詞整組保留、縮寫展開形保留。
6. **公式以 LaTeX 整段抄**，不另行翻譯或簡化。
7. **TERMS_RULE 覆寫**用 inline `**TERMS_RULE 覆寫：**` 寫進該頁，不另立變數。
8. **密集頁（單章 ≥ 50 行）**：prompt 內版面要求切 N 區塊，本次先不主動拆頁，待生圖後再評估。

## 對照表

| Prompt | 主標題 | L23303.txt 行號 | 對應教材小節 |
|---|---|---:|---|
| P01 | 1. 前言與章節導覽 | 7–11 | `# 1.前言與章節導覽` |
| P02 | 2. 模型訓練流程與策略 | 13–15 | `# 2.模型訓練流程與策略` 章節導讀 |
| P03 | 2.（1）資料分割與準備 | 17–42 | `# （1）資料分割與準備`（Training Set / Validation Set / Test Set + K-fold 交叉驗證導入） |
| P04 | 2.（2）批次訓練設計與更新策略 | 44–59 | `# （2）批次訓練設計與更新策略`（Batch GD / SGD / Mini-batch SGD 三種策略） |
| P05 | 2.（3）學習率調整 | 61–78 | `# （3）學習率調整`（固定 / 遞減 / 動態 / 預熱 四種策略） |
| P06 | 2.（4）早停策略與訓練終止準則 | 80–92 | `# （4）早停策略與訓練終止準則`（Early Stopping、Patience、Minimum Delta） |
| P07 | 2.（5）訓練過程的記錄與監控 | 94–108 | `# （5）訓練過程的記錄與監控`（TensorBoard / WandB / MLflow、版本管理、資源使用） |
| P08 | 3. 評估指標與模型效果衡量 | 110–112 | `# 3.評估指標與模型效果衡量` 章節導讀 |
| **P09** | **3.（1）分類任務的評估指標** | **114–185** | `# （1）分類任務的評估指標`（混淆矩陣 + Accuracy / Precision / Recall / F1 / ROC-AUC 五大指標）**密集頁** |
| **P10** | **3.（2）迴歸任務的評估指標** | **187–268** | `# （2）迴歸任務的評估指標`（MSE / MAE / RMSE / R² 含 RSS / TSS 全公式）**密集頁** |
| P11 | 3.（3）模型比較與綜合評估策略 | 270–312 | `# （3）模型比較與綜合評估策略`（指標組合、類別不平衡 SMOTE / Class Weights / Isolation Forest、業務導向 NDCG / Profit Score、多輪驗證 Boxplot / Mean Rank Plot） |
| P12 | 4. 交叉驗證 | 314–316 | `# 4.交叉驗證` 章節導讀 |
| P13 | 4.（1）K-fold | 318–338 | `# （1）K-fold` |
| P14 | 4.（2）Stratified K-fold | 340–358 | `# （2）Stratified K-fold` |
| P15 | 4.（3）LOOCV | 360–384 | `# （3）LOOCV` |
| P16 | 4.（4）Repeated K-fold | 386–404 | `# （4）Repeated K-fold` |

合計 **16 頁**。

## 注意事項

1. **本地行號 vs PDF 全域行號**：對照表中行號為 `chunks/L23303.txt` 內**本地行號**（從 1 開始算）。chunks 檔頭標示「行數範圍：4640–5050」，即本章在原始 PDF 中為第 4640–5050 行。換算公式：

   ```
   PDF 全域行號 = chunks 起始行號（4640）+ 本地行號 − 1
              = 4639 + 本地行號
   ```

   範例：P01 本地 7–11 ⇒ PDF 4646–4650；P09 本地 114–185 ⇒ PDF 4753–4824；P16 本地 386–404 ⇒ PDF 5025–5043。

2. **行號覆蓋率**：
   - 7–404 行幾乎完整覆蓋（除前 6 行檔頭 metadata + 主章標題 `# 5.3 模型訓練、評估與驗證` 行 5、空行行 6、以及 405 行後的 `<details>iPAS</details>` 收尾標籤）。
   - 各頁行號**連續無斷層**，每一行教材內容都至少屬於一個 prompt。
   - 切點位於 chunks 各 `#` heading 之前的空行，符合段落分隔。

3. **密集頁警示（先不主動拆頁）**：
   - **P09（3.（1）分類任務的評估指標，72 行）**：含 Confusion Matrix 2×2 表格 + 5 大指標（Accuracy / Precision / Recall / F1 / ROC-AUC），prompt 已要求版面切「上半混淆矩陣 + 下半 5 卡」結構。生圖後若不可讀，建議拆為 P09a（混淆矩陣 + Accuracy / Precision / Recall）+ P09b（F1 + ROC-AUC）兩張，主標題保留 chunks 原文。
   - **P10（3.（2）迴歸任務的評估指標，82 行）**：含 MSE / MAE / RMSE / R² 四個公式，且 R² 還含 RSS / TSS 子公式。prompt 已要求 2×2 四象限版面。生圖後若不可讀，建議拆為 P10a（MSE / MAE / RMSE 三個誤差類）+ P10b（R² 含 RSS / TSS 與三條判別小註）兩張。
   - 本次第一輪交付按「一頁一 heading」原則先不拆，把球丟回給使用者看實際生圖效果決定。

4. **TERMS_RULE 覆寫頁清單**（共 2 頁有 inline 覆寫）：
   - **P09**：「混淆矩陣 / 準確率 / 精確率 / 召回率 / F1 分數 / ROC 曲線 / AUC」中文主詞鎖死，且 TP / TN / FP / FN 縮寫與其展開形（True Positive 等）需同時出現。
   - **P15**：「LOOCV（Leave-One-Out Cross-Validation）」全稱與縮寫必須完整保留，不可只寫 leave-one-out 或 LOO。
   - 其餘頁使用共用 TERMS_RULE 即可。

5. **章節導讀頁（P02 / P08 / P12）內容偏輕**：原文每段僅 2–3 句話，prompt 已加上「指向子小節入口」設計讓版面有東西可呈現。如果嫌三張導讀頁佔頁數，可將其各自合併進該章 `（1）` 那頁（會回到 13 頁版本）；本檔保留導讀頁以維持章節層次。

6. **公式重點清單**（共 4 頁有公式）：
   - P09：Accuracy / Precision / Recall / F1 四式
   - P10：MSE / MAE / RMSE / R²（含 RSS、TSS）四式
   - 其餘頁無公式，純文字 + 流程示意。

## 用途

- **校對**：每頁 prompt 是否漏掉教材原詞，照本地行號回 `chunks/L23303.txt` 抓教材原文補；若需回原始 PDF 校對，用上述換算公式轉成 PDF 全域行號。
- **擴 / 減頁決策**：要把 P09 / P10 拆成子頁（密集頁警示），或把章節導讀（P02 / P08 / P12）合併進該章 `（1）` 時，看本表行號邊界決定切點。
- **跨章節參考**：之後 L23304+ 章節可套同樣的「章節嚴格沿用 chunks heading + 密集小節必要時拆子頁」原則編 prompts.md + prompts_to_chunks.md。

— 編表：Heiter（2026-05-05）