# L23303 模型訓練、評估與驗證 — 模擬試題 30 題

> 題型：四選一單選題（iPAS AI 規劃師中級 標準題型）
> 教材來源：`chunks/L23303.txt`（每題解析末標 chunks 行號）
> 視覺輔助：`output3/L23303_模型訓練評估與驗證/images/` 投影片
> 命題原則：用易混淆概念設計干擾項（同類項換位、屬性錯配、定義 partial swap）

---

## 第一部分｜資料分割與訓練流程（Q1–Q5）

### Q1
下列關於**訓練集（Training Set）、驗證集（Validation Set）、測試集（Test Set）三者角色**的對應，何者**正確**？
- (A) 訓練集 → 學習與內部結構調整；驗證集 → 調整**超參數**與監控訓練過程；測試集 → 訓練完成後進行最終效能評估,模擬實際部署
- (B) 訓練集 → 最終效能評估；驗證集 → 學習與調整；測試集 → 超參數調整
- (C) 三者完全相同,可以隨意互換
- (D) 測試集應在訓練過程中即時使用,用以指導模型學習

**答案：(A)**
解析：標準切分 — Training 學參數 / Validation 調超參數 + 監控 / Test 最終評估。常見干擾項把三者角色互換或讓測試集介入訓練（會造成資料洩漏）。（chunks line 21–31）

---

### Q2
下列關於 **K-fold 交叉驗證（K-fold Cross-Validation）**的運作原理敘述，何者**正確**？
- (A) 將原始資料集平均劃分為 **K 個不重疊的子集（folds）**,每次選定 1 折作為驗證集,其餘 K-1 折作為訓練集,重複 K 次後計算指標平均
- (B) 將資料分為 2 折,訓練測試各一半
- (C) K-fold 只執行 1 次,不需要重複迭代
- (D) K-fold 結果無法比平均,需用最後一折結果

**答案：(A)**
解析：K-fold 標準流程 = 分 K 折 → 輪流以其中 1 折驗證、K-1 折訓練 → 重複 K 次 → 平均。常見 K=5 或 10,在精確度與運算效率間取得平衡。（chunks line 37–42、322–325）

---

### Q3
下列關於**全量訓練（Batch Gradient Descent）**的敘述，何者**正確**？
- (A) 每輪迭代使用**全部資料**進行梯度計算,方向穩定、收斂路徑平滑,但對記憶體要求高,且不易應用於大規模資料
- (B) 每次僅使用一筆樣本進行參數更新
- (C) 每次使用固定筆數樣本進行更新
- (D) 不計算梯度,直接隨機更新權重

**答案：(A)**
解析：Batch GD 用全部資料算一次梯度;優點是路徑平滑;缺點是記憶體耗用大,難以用於大資料。(B) 是 SGD;(C) 是 Mini-batch SGD;(D) 是錯誤敘述。（chunks line 48–50）

---

### Q4
下列關於**隨機梯度下降（Stochastic Gradient Descent, SGD）**的敘述，何者**錯誤**？
- (A) 每次僅使用**一筆樣本**進行參數更新
- (B) 適合線上學習與資料流架構
- (C) 更新震盪較大,收斂速率不穩
- (D) 與全量訓練完全等價,計算結果完全相同

**答案：(D)**
解析：SGD 與 Batch GD **不等價** — SGD 用單筆樣本,梯度估計噪聲大、震盪明顯但能跳出局部最優;Batch GD 用全部資料,方向穩定。常見干擾項以「等價」誘答。（chunks line 52–54）

---

### Q5
下列關於 **Mini-batch SGD（小批次訓練）**的敘述，何者**正確**？
- (A) 每次使用**固定筆數樣本**進行更新,**兼具全量與隨機策略的優點**,是目前深度學習最常用的方法
- (B) 每次只使用 1 筆樣本
- (C) 每次使用全部樣本
- (D) Batch size 與梯度估計準確性、訓練速度無關

**答案：(A)**
解析：Mini-batch 介於 Batch GD 與 SGD 之間 — 兼顧梯度穩定與更新效率,是 DL 主流方法;Batch size 會影響梯度估計準確性與訓練速度,需依 GPU 記憶體與任務調整。常見干擾項。（chunks line 56–59）

---

## 第二部分｜學習率與訓練終止（Q6–Q9）

### Q6
下列關於**學習率（Learning Rate）**的敘述，何者**錯誤**？
- (A) 控制模型每次更新的步伐
- (B) 是訓練過程中重要的超參數之一
- (C) 學習率永遠**越大越好**,模型收斂越快
- (D) 可採用固定、遞減、動態調整或預熱等策略

**答案：(C)**
解析：學習率不是越大越好 — 太大會震盪或發散,太小會收斂慢；應根據場景選擇合適策略。常見干擾項以絕對化敘述誘答。（chunks line 63–78）

---

### Q7
下列關於**遞減學習率（Step Decay / Exponential Decay）**的敘述，何者**正確**？
- (A) 根據訓練次數或驗證集表現,**定期降低**學習率,有助於穩定收斂
- (B) 定期增加學習率,加速收斂
- (C) 與初始學習率完全無關
- (D) 必然導致過擬合

**答案：(A)**
解析：Step Decay / Exponential Decay = 隨訓練進行逐步降低學習率,讓後期收斂更穩定。常見干擾項把方向反轉。（chunks line 69–71）

---

### Q8
下列關於**動態調整學習率（如 PyTorch 的 ReduceLROnPlateau）**的敘述，何者**正確**？
- (A) 當驗證效能**停滯**時自動**調降**學習率,精細控制學習節奏
- (B) 當驗證效能停滯時自動**提升**學習率
- (C) 不能與其他策略合併使用
- (D) 與驗證集表現完全無關

**答案：(A)**
解析：ReduceLROnPlateau = 監控驗證指標,當其停滯時自動調降學習率,讓訓練在卡關時找到更細的下降方向。常見干擾項把方向反轉。（chunks line 73–76）

---

### Q9
下列關於**預熱策略（Warmup）**的敘述，何者**正確**？
- (A) 訓練初期使用較低學習率,**逐漸升高**,有助於避免初期梯度爆炸;常見於 Transformer 類模型
- (B) 訓練初期使用最高學習率,逐漸降低
- (C) 與 Transformer 完全無關
- (D) 預熱策略會導致梯度消失

**答案：(A)**
解析：Warmup = 從低學習率慢慢升高,避免初期梯度爆炸,在 Transformer 訓練中非常常見。常見干擾項把方向反轉。（chunks line 78）

---

## 第三部分｜早停策略與訓練監控（Q10–Q12）

### Q10
下列關於 **Early Stopping（早停策略）**的敘述，何者**正確**？
- (A) 透過監控**驗證集效能**判斷訓練何時應中止;若訓練過久,模型可能過擬合訓練資料
- (B) 透過監控訓練集損失判斷
- (C) 透過監控測試集表現決定
- (D) 不需要任何監控指標,訓練到預設 epoch 數即停

**答案：(A)**
解析：Early Stopping = 監控**驗證集**指標,若連續 N 次無明顯改善則終止;若監控訓練集會錯失過擬合警訊。常見干擾項把監控目標換成訓練集或測試集。（chunks line 82–86）

---

### Q11
下列關於 Early Stopping「**容忍次數（Patience）**」與「**最小改善幅度（Minimum Delta）**」的設定，何者**正確**？
- (A) Patience = 驗證指標若在**連續 N 次迭代**內無明顯改善則終止訓練；Min Delta = 效能提升若小於閾值,亦可視為無效進步
- (B) Patience 是學習率的另一名稱
- (C) Min Delta 是模型最低準確率閾值
- (D) Patience 與 Min Delta 都是訓練集相關指標

**答案：(A)**
解析：Patience = 等待 N 次無進步;Min Delta = 改善幅度的最低門檻。兩者通常合用以判斷「無實質改進」。（chunks line 84–90）

---

### Q12
下列關於**訓練過程記錄與監控**的工具，何者**並非**教材列舉的視覺化平台？
- (A) TensorBoard
- (B) WandB（Weights & Biases）
- (C) MLflow
- (D) **Microsoft Excel**

**答案：(D)**
解析：教材列出 TensorBoard / WandB / MLflow 為訓練監控的標準工具;Excel 不在列舉範圍。常見干擾項。（chunks line 98–104）

---

## 第四部分｜分類任務評估指標（Q13–Q19）

### Q13
下列關於**混淆矩陣（Confusion Matrix）**中 TP、FP、FN、TN 的定義對應，何者**正確**？
- (A) TP = 預測為正且實際為正；FP = 預測為正但實際為負；FN = 預測為負但實際為正；TN = 預測為負且實際為負
- (B) TP = 預測為正但實際為負；FP = 預測為正且實際為正
- (C) FN = 預測為正且實際為正
- (D) TN = 預測為正且實際為正

**答案：(A)**
解析：混淆矩陣標準定義 — 「真正/假正/假負/真負」分別對應「正確標正/錯誤標正/錯誤標負/正確標負」;最容易混淆的是 FP（誤報）與 FN（漏報）。（chunks line 118–130）

---

### Q14
下列關於**準確率（Accuracy）**的敘述，何者**錯誤**？
- (A) 公式 = (TP + TN) / (TP + TN + FP + FN)
- (B) 適用於類別分佈相對均衡的情況
- (C) 在嚴重類別不平衡的資料中容易**誤導**（例如 95% 樣本為負類時,即使模型全預測為負,準確率仍高達 95%）
- (D) **不管類別分佈如何,Accuracy 永遠是最佳評估指標**

**答案：(D)**
解析：Accuracy 在類別不平衡時會嚴重誤導,此時應該改用 Precision/Recall/F1/AUC 等指標。常見干擾項以絕對化敘述誘答。（chunks line 134–139）

---

### Q15
下列關於**精確率（Precision）與召回率（Recall）**的差異敘述，何者**正確**？
- (A) **Precision** = TP / (TP + FP),衡量「被預測為正的樣本中實際為正的比例」,適用於**誤報正類代價高**（如垃圾郵件分類、醫療誤診）;**Recall** = TP / (TP + FN),衡量「實際正類中被正確抓到的比例」,適用於**漏報正類代價高**（如癌症偵測、詐騙偵測）
- (B) Precision 與 Recall 完全相同
- (C) Precision 適用於漏報代價高的場景
- (D) Recall 公式為 TP / (TP + FP)

**答案：(A)**
解析：Precision 看「預測為正的可信度」,適用怕誤報的場景;Recall 看「實際正類抓到多少」,適用怕漏報的場景。常見干擾項把 (A) 兩者特性與場景對調。（chunks line 141–153）

---

### Q16
下列關於 **F1 分數（F1-Score）**的敘述，何者**正確**？
- (A) F1 = 2 × (Precision × Recall) / (Precision + Recall),是精確率與召回率的**調和平均**,適用於兩者間需取得平衡且類別不平衡嚴重時
- (B) F1 = (Precision + Recall) / 2,是算術平均
- (C) F1 與 Precision、Recall 無關
- (D) F1 只能用於迴歸任務

**答案：(A)**
解析：F1 = 調和平均(harmonic mean),對 Precision 與 Recall 中**較低值**敏感;適合平衡需求 + 類別不平衡情境。常見干擾項以算術平均誘答。（chunks line 155–159）

---

### Q17
下列關於 **ROC 曲線與 AUC（Area Under Curve）**的敘述，何者**正確**？
- (A) ROC 曲線橫軸為**假正率（FPR）**、縱軸為**真正率（TPR）**;AUC 越接近 **1**,模型越好;適用於需綜觀整體預測能力時,特別是需調整分類閾值的應用
- (B) ROC 橫軸為 TPR、縱軸為 FPR
- (C) AUC 越接近 0,模型越好
- (D) AUC 只能用於迴歸任務

**答案：(A)**
解析：ROC = FPR(橫) vs TPR(縱);AUC ∈ [0, 1],越靠近 1 越好,0.5 為隨機水準;適合需要綜觀所有閾值下的整體區分能力。常見干擾項把橫縱軸或 AUC 方向對調。（chunks line 174–185）

---

### Q18
下列關於「醫療誤診」與「癌症偵測」兩個情境**該優先關注的分類指標**，何者**正確**？
- (A) 醫療誤診（怕誤判健康人為癌）→ Precision；癌症偵測（怕漏掉真癌患）→ Recall
- (B) 醫療誤診 → Recall；癌症偵測 → Precision
- (C) 兩種情境都只看 Accuracy
- (D) 兩種情境都看 RMSE

**答案：(A)**
解析：誤報代價高（健康人被誤判要做大手術）→ 看 Precision；漏報代價高（癌症漏診錯失治療）→ 看 Recall。常見干擾項把兩者指標對調。（chunks line 145–153）

---

### Q19
下列關於類別不平衡情境**評估策略**的敘述，何者**錯誤**？
- (A) 結合 **F1 分數、ROC-AUC、混淆矩陣**等多指標可避免單一指標掩蓋類別偏誤
- (B) 可使用**類別重加權（Class Weights）** 於損失函數,強化少數類學習
- (C) 可使用 **SMOTE** 進行過採樣,合成新樣本平衡資料
- (D) 類別不平衡時應**只看 Accuracy**,其他指標都無用

**答案：(D)**
解析：類別不平衡時 Accuracy 會嚴重誤導;教材建議結合多指標 + 類別重加權 + 過採樣（SMOTE）+ 異常值建模等多種策略。常見干擾項以絕對化敘述誘答。（chunks line 274–292）

---

## 第五部分｜迴歸任務評估指標（Q20–Q24）

### Q20
下列關於**均方誤差（Mean Squared Error, MSE）**的敘述，何者**正確**？
- (A) MSE = 1/n × Σ(yᵢ - ŷᵢ)²,對**大誤差高度敏感**,會放大極端偏差的影響,適用於需強調大誤差懲罰的任務（如金融風險預測、製程品質監控）
- (B) MSE 對大誤差不敏感
- (C) MSE 是平均絕對誤差的別稱
- (D) MSE 無法用於迴歸任務

**答案：(A)**
解析：MSE 平方項會放大誤差,所以對極端偏差特別敏感,適合「大誤差不能容忍」的場景。常見干擾項。（chunks line 191–201）

---

### Q21
下列關於**平均絕對誤差（Mean Absolute Error, MAE）**的敘述，何者**正確**？
- (A) MAE = 1/n × Σ|yᵢ - ŷᵢ|,**對異常值較不敏感**,提供穩定的誤差估計,適用於資料具偏態分佈或含少量極端值時
- (B) MAE 對異常值極為敏感,會放大極端偏差
- (C) MAE 是均方誤差的別稱
- (D) MAE 只適用於常態分佈資料

**答案：(A)**
解析：MAE 取絕對值,沒有平方項,因此**對異常值較不敏感**(相對 MSE),適合資料含離群值或偏態的情境。常見干擾項把 MAE 與 MSE 特性對調。（chunks line 203–212）

---

### Q22
下列關於**均方根誤差（Root Mean Squared Error, RMSE）**的敘述，何者**正確**？
- (A) RMSE = √MSE,保有 MSE 的懲罰特性,同時**回到與預測變數相同的單位**
- (B) RMSE = MAE × 2
- (C) RMSE 與 MSE 完全不同,沒有任何關係
- (D) RMSE 無法用於模型比較

**答案：(A)**
解析：RMSE 是 MSE 開根號,在保留對大誤差敏感的同時,讓誤差數值回到與原變數相同的單位（更易解釋）;廣泛用於報告與模型比較。（chunks line 214–223）

---

### Q23
下列關於**決定係數（R² Score）判別**的敘述，何者**正確**？
- (A) R² = 1：模型能**完全解釋**資料變異,預測完美；R² = 0：模型僅與常數模型（如直接預測平均值）同等表現；**R² < 0**：模型比常數模型還差
- (B) R² 一定大於等於 0
- (C) R² = 1 表示完全失敗
- (D) R² 越接近 0,模型越好

**答案：(A)**
解析：R² 的三個關鍵分界 — 1（完美）/ 0（與均值模型同）/ <0（比均值模型還差）;常見干擾項以「R² 必為正」誘答（其實會 <0）。（chunks line 264–268）

---

### Q24
下列關於 R² 的「**適用情境**」敘述，何者**錯誤**？
- (A) 適用於線性迴歸模型,可快速評估預測能力
- (B) 不適用於非線性或未標準化資料下的模型比較,易失真
- (C) 對於不同任務或資料集間的 R² **無法直接比較**
- (D) R² 可以跨任務、跨資料集**直接比較**,作為唯一評估標準

**答案：(D)**
解析：R² 在不同任務或資料集間**不能直接比較**(會被資料分佈影響);應結合 MAE、RMSE 等多指標。常見干擾項。（chunks line 258–263）

---

## 第六部分｜交叉驗證方法（Q25–Q30）

### Q25
下列關於 **K-fold 交叉驗證**的「特點」敘述，何者**錯誤**？
- (A) 減少資料切分偏差,適用性廣
- (B) 能有效評估模型在不同樣本上的表現穩定性
- (C) 每次需重新訓練模型,**計算成本為 K 倍**
- (D) **計算成本與 K 無關**,執行 K 次與執行 1 次成本相同

**答案：(D)**
解析：K-fold 要訓練 K 次,計算成本約為單次的 K 倍;常見 K=5 或 10 是在精確度與運算效率間取平衡。常見干擾項。（chunks line 327–332）

---

### Q26
下列關於 **Stratified K-fold（分層 K 折交叉驗證）**的敘述，何者**正確**？
- (A) 於劃分時確保**每一折中各類別的比例與整體資料集相符**,特別適用於**類別分佈不均**的資料（如欺詐偵測、疾病分類）
- (B) 隨機切分,不考慮類別比例
- (C) 適用於迴歸任務,不適用於分類
- (D) 與標準 K-fold 完全相同

**答案：(A)**
解析：Stratified K-fold = 按類別比例分層抽樣,避免某些 fold 中正/負樣本嚴重失衡導致評估失真;是**分類任務交叉驗證的預設方式**。常見干擾項。（chunks line 342–356）

---

### Q27
下列關於 **LOOCV（Leave-One-Out Cross-Validation）**的敘述，何者**正確**？
- (A) K-fold 的**極端形式**：K 等於樣本數 n,每次僅留下**一筆樣本**作為驗證,其餘 n-1 筆訓練;共執行 n 次
- (B) 隨機留下 30% 樣本作為驗證
- (C) 不需要訓練模型
- (D) 計算成本極低,適合大資料集

**答案：(A)**
解析：LOOCV = K-fold 取 K = n 的極端形式,需訓練 n 次;優點是評估偏差最小、適合樣本珍貴的情境(如臨床研究、稀有病資料);缺點是計算成本極高。常見干擾項。（chunks line 361–384）

---

### Q28
下列關於 **LOOCV 的特點**敘述，何者**錯誤**？
- (A) 評估偏差最小,適合樣本珍貴或不可浪費的情境
- (B) 因需訓練 n 次模型,計算成本極高
- (C) 敏感於訓練集的微小變動,模型表現波動較大
- (D) **計算成本極低**,適用於百萬級樣本資料集

**答案：(D)**
解析：LOOCV 計算成本極高(N 次訓練),完全**不適合**大資料集;適用情境是樣本珍貴的小資料(臨床/稀有病)。常見干擾項以方向反轉誘答。（chunks line 368–384）

---

### Q29
下列關於 **Repeated K-fold（重複 K-fold）**的敘述，何者**正確**？
- (A) 執行**多輪 K-fold 驗證**（如 10-fold × 5 次）,每輪隨機重分 fold,計算平均與變異;可觀察模型在不同劃分下的表現波動與可信區間
- (B) 只執行一次 K-fold
- (C) 重複 K-fold 無法觀察變異
- (D) Repeated K-fold 等於 LOOCV

**答案：(A)**
解析：Repeated K-fold = 多輪 K-fold + 隨機重分,提升穩定性觀察。常用於調參、學術論文需要報告標準差/置信區間時。常見干擾項把方法搞混。（chunks line 386–404）

---

### Q30
下列對於**交叉驗證方法**的對應，何者**錯誤**？
- (A) K-fold → 通用,適用迴歸與分類
- (B) Stratified K-fold → 分類資料不均衡的預設方式
- (C) LOOCV → K = n 的極端形式,適合樣本珍貴的小資料
- (D) **Repeated K-fold → 只能用於 K = n 的情境**

**答案：(D)**
解析：Repeated K-fold 是「多輪標準 K-fold（如 5-fold × 多次）」,**不是 LOOCV**;LOOCV 才是 K = n 的極端形式。常見干擾項把 Repeated K-fold 與 LOOCV 搞混。（chunks line 318–404）

---

## 答案速查表

| Q | 答 | Q | 答 | Q | 答 |
|---|---|---|---|---|---|
| 1 | A | 11 | A | 21 | A |
| 2 | A | 12 | D | 22 | A |
| 3 | A | 13 | A | 23 | A |
| 4 | D | 14 | D | 24 | D |
| 5 | A | 15 | A | 25 | D |
| 6 | C | 16 | A | 26 | A |
| 7 | A | 17 | A | 27 | A |
| 8 | A | 18 | A | 28 | D |
| 9 | A | 19 | D | 29 | A |
| 10 | A | 20 | A | 30 | D |

## 命題分布統計

| 章節 | 題號 | 題數 | 重點 |
|---|---|---:|---|
| 資料分割與訓練流程 | Q1–Q5 | 5 | 訓練/驗證/測試三集角色、K-fold 流程、Batch / SGD / Mini-batch SGD 三種梯度下降 |
| 學習率與訓練終止 | Q6–Q9 | 4 | 學習率超參、Step Decay、ReduceLROnPlateau、Warmup |
| 早停策略與訓練監控 | Q10–Q12 | 3 | Early Stopping、Patience、Min Delta、TensorBoard/WandB/MLflow |
| 分類任務評估指標 | Q13–Q19 | 7 | 混淆矩陣 TP/FP/FN/TN、Accuracy、Precision vs Recall、F1、ROC/AUC、誤診 vs 漏診情境、類別不平衡策略 |
| 迴歸任務評估指標 | Q20–Q24 | 5 | MSE、MAE、RMSE、R² 判別與適用情境 |
| 交叉驗證方法 | Q25–Q30 | 6 | K-fold 特點、Stratified K-fold、LOOCV、Repeated K-fold |
| **合計** | — | **30** | — |

## 易混淆考點清單（找混淆提示詞輸出）

| # | 易混淆對 | 差異 |
|---|---|---|
| 1 | 訓練集 vs 驗證集 vs 測試集 | 學參數 vs 調超參+監控 vs 最終評估;測試集不能介入訓練（Q1） |
| 2 | Batch GD vs SGD vs Mini-batch SGD | 全資料/1 筆/固定 batch（Q3/Q4/Q5） |
| 3 | Step Decay vs ReduceLROnPlateau vs Warmup | 定期降 vs 停滯降 vs 初期升（Q7/Q8/Q9） |
| 4 | TP / FP / FN / TN | 預測×實際 四象限,最易混淆 FP（誤報）vs FN（漏報）（Q13） |
| 5 | Precision vs Recall | 怕誤報用 P；怕漏報用 R（Q15/Q18） |
| 6 | F1 算術平均 vs 調和平均 | F1 = 調和平均（不是算術平均）（Q16） |
| 7 | ROC 橫縱軸與 AUC 方向 | 橫=FPR 縱=TPR；AUC 越接近 1 越好（Q17） |
| 8 | MSE vs MAE vs RMSE | MSE 放大大誤差;MAE 抵抗異常值;RMSE = √MSE 回原單位（Q20/Q21/Q22） |
| 9 | R² = 1 / 0 / <0 的意義 | 完美 / 與均值同 / 比均值還差（Q23） |
| 10 | K-fold vs Stratified vs LOOCV vs Repeated K-fold | 通用 vs 分類分層 vs K=n 極端 vs 多輪隨機重分（Q25/Q26/Q27/Q29/Q30） |

---

— 命題：Heiter（2026-05-12）
— 對應投影片版本：L23303 章節完整版（涵蓋資料分割、訓練流程與學習率、早停、分類/迴歸評估指標、交叉驗證方法）