# L23201 機器學習原理與技術 — 模擬試題 30 題

> 題型：四選一單選題（iPAS AI 規劃師中級 標準題型）
> 教材來源：`chunks/L23201.txt`（每題解析末標 chunks 行號）
> 視覺輔助：`output3/L23201_機器學習原理與技術/images/` 23 張投影片（含 P16b）
> 命題原則：用易混淆概念設計干擾項（同類項換位、屬性錯配、定義 partial swap），對應「找混淆」提示詞。

---

## 第一部分｜前言與三大範式（Q1–Q3）

### Q1
下列關於機器學習（Machine Learning, ML）與傳統規則式系統的差別，何者**錯誤**？
- (A) 機器學習強調透過資料經驗自動學習模型
- (B) 傳統規則式系統依賴人為定義的規則
- (C) 機器學習依資料中的統計規律萃取模式
- (D) 傳統規則式系統可從資料分佈自動歸納模式

**答案：(D)**
解析：傳統規則式系統依賴人工規則，**無法**從資料自動歸納；自動歸納正是機器學習與規則式系統最大區別。（chunks line 9）

---

### Q2
教材所列「機器學習本質的 5 大環節」**不包含**下列何者？
- (A) 任務類型
- (B) 學習目標
- (C) 部署策略
- (D) 評估過程

**答案：(C)**
解析：5 大環節 =「任務類型／學習目標／資料假設／模型訓練／評估過程」，5 項地位平等；「部署策略」不在其中（常見干擾項，誤把監督式的「測試與部署」階段塞進來）。（chunks line 13）

---

### Q3
下列何者**並非**教材所提機器學習三大核心範式之一？
- (A) 監督式學習（Supervised Learning）
- (B) 非監督式學習（Unsupervised Learning）
- (C) 強化式學習（Reinforcement Learning）
- (D) 半監督式學習（Semi-Supervised Learning）

**答案：(D)**
解析：教材定義三大核心範式為監督式／非監督式／強化式；半監督式僅在非監督應用場景中提及（作為「先備處理階段」），非教材列為核心範式。（chunks line 13、236）

---

## 第二部分｜機器學習的基本結構（Q4–Q9）

### Q4
關於特徵空間（Feature Space），下列敘述何者**正確**？
- (A) 特徵空間僅適用於影像資料
- (B) 樣本可視為特徵空間中的一個點，整體幾何分佈會影響模型表現
- (C) 特徵空間維度越高，模型表現一定越好
- (D) 結構化表格資料不需經過前處理即可進入特徵空間

**答案：(B)**
解析：每筆樣本為特徵空間中一個點，整體幾何分佈（密集程度、邊界形狀）會直接影響模型能否有效分類、預測、分群。(C) 是「維度災難」反例；(D) 任何資料都需轉成向量/矩陣才能輸入模型。（chunks line 23–25）

---

### Q5
下列任務與其標籤型態的配對，何者**錯誤**？
- (A) 分類（Classification）— 離散型類別
- (B) 迴歸（Regression）— 連續實數
- (C) 聚類（Clustering）— 已知類別標籤
- (D) 降維（Dimensionality Reduction）— 高維轉低維、保留資料結構

**答案：(C)**
解析：聚類為**非監督**任務，是在「無標籤」情況下依樣本間相似度分群；如果已知類別標籤，那就變成分類問題。（chunks line 39–41、180）

---

### Q6
下列模型與其隱含假設（Hypothesis Space）的配對，何者**正確**？
- (A) 線性模型 — 透過條件規則進行分類
- (B) 決策樹 — 假設樣本可用線性邊界區分
- (C) 神經網路 — 透過非線性結構學習抽象表示
- (D) 神經網路 — 假設樣本可用線性邊界區分

**答案：(C)**
解析：線性模型 = 線性邊界；決策樹 = 條件規則；神經網路 = 非線性結構學習抽象表示。(A)(B)(D) 都是把三種模型的假設兩兩對調，是常見混淆干擾項。（chunks line 57–59）

---

### Q7
下列損失函數（Loss Function）與其適用情境的配對，何者**錯誤**？
- (A) 均方誤差（Mean Squared Error, MSE）— 迴歸任務，對大誤差懲罰較重
- (B) 平均絕對誤差（Mean Absolute Error, MAE）— 迴歸任務，對異常值較具魯棒性
- (C) 交叉熵損失（Cross-Entropy Loss）— 分類任務，衡量預測機率分佈與實際標籤的差距
- (D) 交叉熵損失（Cross-Entropy Loss）— 迴歸任務，衡量連續數值間的距離

**答案：(D)**
解析：交叉熵 = **分類**任務，不是迴歸。常見干擾：把 MSE 跟 Cross-Entropy 互換適用情境。（chunks line 69–75）

---

### Q8
關於資料分割三段（Train/Validation/Test）的用途，下列敘述何者**錯誤**？
- (A) 訓練集（Training Set）用於模型參數的學習
- (B) 驗證集（Validation Set）用於最終評估模型表現
- (C) 驗證集（Validation Set）用於調整超參數與監控過擬合
- (D) 測試集（Test Set）用於最終評估模型表現

**答案：(B)**
解析：「最終評估」是測試集的用途；驗證集是「調超參數與監控過擬合」。常見混淆點 — 把 Validation 跟 Test 的用途對調。（chunks line 83–85）

---

### Q9
下列何者**並非**教材所列迴歸任務的評估指標？
- (A) 平均絕對誤差（MAE）
- (B) 均方誤差（MSE）
- (C) 決定係數（R²）
- (D) F1 分數

**答案：(D)**
解析：F1 分數為**分類**任務指標（與 Accuracy、Precision/Recall 同組）；迴歸三指標 = MAE / MSE / R²。（chunks line 91–95）

---

## 第三部分｜監督式學習（Q10–Q14）

### Q10
監督式學習（Supervised Learning）的核心目標為何？
- (A) 從無標註資料中發現潛在結構
- (B) 透過與環境互動最大化長期累積報酬
- (C) 透過「標註資料（Labeled Data）」學習映射函數，使模型能根據輸入特徵預測對應輸出
- (D) 將高維資料降維至 2D/3D 空間以利視覺化

**答案：(C)**
解析：監督式 = 透過標註資料學映射函數；(A) 是非監督，(B) 是 RL，(D) 是降維任務（非監督子任務）。（chunks line 101–103）

---

### Q11
監督式學習典型訓練流程的**正確順序**為何？
- (A) 模型訓練 → 資料準備與標記 → 驗證與調整 → 測試與部署
- (B) 資料準備與標記 → 模型訓練 → 驗證與調整 → 測試與部署
- (C) 資料準備與標記 → 驗證與調整 → 模型訓練 → 測試與部署
- (D) 模型訓練 → 驗證與調整 → 資料準備與標記 → 測試與部署

**答案：(B)**
解析：4 階段順序 = ①資料準備與標記 → ②模型訓練 → ③驗證與調整 → ④測試與部署。（chunks line 135–148）

---

### Q12
下列何者**並非**監督式學習的典型應用場景？
- (A) 圖像分類（影像 → 物件類別）
- (B) 客戶分群與行為分析（電商、行銷）
- (C) 客戶信用風險評估（資料 → 信用等級）
- (D) 醫療診斷（病患資訊 → 疾病類型）

**答案：(B)**
解析：客戶分群為**非監督**式應用（依相似度自動分群）；其餘三項為監督式三大典型應用。（chunks line 154–156、230）

---

### Q13
分類模型在預測階段，通常如何決定最終預測結果？
- (A) 直接輸出實數值
- (B) 輸出各類別預測機率，再根據最高機率選擇預測類別
- (C) 依樣本相似度自動分群
- (D) 依環境回饋報酬調整預測

**答案：(B)**
解析：分類模型輸出各類別預測機率分佈，取最高機率類別為預測結果。(A) 是迴歸，(C) 是聚類，(D) 是 RL。（chunks line 122）

---

### Q14
教材指出監督式學習成敗的**關鍵**為何？
- (A) 模型結構越深越好
- (B) 訓練資料越多越好，與標註品質無關
- (C) 資料的標註品質與特徵設計的精準性
- (D) 演算法選擇優先於資料品質

**答案：(C)**
解析：模型效能高度仰賴標註品質與特徵設計，資料前處理、特徵選擇與轉換是監督式學習成敗的關鍵。（chunks line 158）

---

## 第四部分｜非監督式學習（Q15–Q22，含 P16b 評估方法重點）

### Q15
關於非監督式學習（Unsupervised Learning）的特徵，下列敘述何者**錯誤**？
- (A) 在無標註資料情況下進行學習
- (B) 核心目的是從原始資料中發現潛在結構、模式或分佈特性
- (C) 模型輸出通常是具體的預測值（與監督式相同）
- (D) 適用於探索性分析、資料壓縮與隱含關係挖掘

**答案：(C)**
解析：非監督輸出**不是**具體預測值，而是分組歸類、降維投影、潛藏變數估計。是與監督式最常被混淆的點。（chunks line 162、166–170）

---

### Q16
下列任務何者**不屬於**非監督式學習的四大主要任務類型？
- (A) 聚類（Clustering）
- (B) 降維（Dimensionality Reduction）
- (C) 序列決策（Sequential Decision）
- (D) 關聯規則學習（Association Rule Learning）

**答案：(C)**
解析：序列決策屬於**強化式**學習；非監督四大任務 = Clustering / Dimensionality Reduction / Association Rule Learning / Representation Learning。（chunks line 47–49、178–192）

---

### Q17 ★【P16b 重點】
下列何者**為**非監督式學習的**內部評估指標**？
- (A) F1 分數
- (B) Silhouette score（輪廓係數）
- (C) Rand Index
- (D) Adjusted Mutual Information（AMI）

**答案：(B)**
解析：內部評估指標 = Silhouette score（輪廓係數）／Davies-Bouldin（指數）／Reconstruction Error（重建誤差），依資料本身結構特徵評估。F1 是分類指標；Rand Index 與 AMI 是**外部**評估指標。（chunks line 208–214；對應投影片 P16b 左欄）

---

### Q18 ★【P16b 重點】
下列何者**為**非監督式學習的**外部評估指標**？
- (A) Silhouette score（輪廓係數）
- (B) Davies-Bouldin（指數）
- (C) Reconstruction Error（重建誤差）
- (D) Rand Index

**答案：(D)**
解析：外部評估指標 = Rand Index、Adjusted Mutual Information（AMI），須有「部分標籤」可參考時才能使用；(A)(B)(C) 為內部指標。（chunks line 216–220；對應投影片 P16b 中欄）

---

### Q19 ★【P16b 重點】
教材指出非監督式學習的**視覺化輔助分析**方法為何？
- (A) 將低維資料升維至高維空間後繪圖
- (B) 將高維結果降維至 2D/3D 空間進行圖形檢視
- (C) 直接列出原始高維座標點
- (D) 將樣本轉換成文字描述後人工檢視

**答案：(B)**
解析：常用方法 = 將高維結果降維至 2D/3D 空間進行圖形檢視，是非監督式中常見的理解方式。（chunks line 222–224；對應投影片 P16b 右欄）

---

### Q20
下列何者**並非**非監督式學習常見的應用領域？
- (A) 客戶分群與行為分析（電商、行銷）
- (B) 社群偵測與異常發現（社群網路、資安）
- (C) 醫療診斷（病患資訊 → 疾病類型）
- (D) 主題模型與語意分析（自然語言處理）

**答案：(C)**
解析：醫療診斷為**監督式**學習應用（已知疾病類別作標籤）；非監督五大應用 = 客戶分群／社群偵測／影像壓縮／主題模型／特徵工程。（chunks line 156、230–234）

---

### Q21
非監督式訓練流程中，下列何者**並非**教材列出的步驟？
- (A) 資料準備與標準化（特徵縮放、中心化）
- (B) 模型選擇與超參數設定（如聚類數 k）
- (C) 模型擬合與重複迭代（許多方法依賴初始條件）
- (D) 標籤校驗與重新標註

**答案：(D)**
解析：非監督**無標籤**，故無「標籤校驗」步驟；訓練三步 = 準備標準化 → 模型選擇+超參數 → 擬合迭代。（chunks line 200–204）

---

### Q22 ★【P16b 重點】
關於 Reconstruction Error（重建誤差），下列敘述何者**正確**？
- (A) 屬於外部評估指標，需要真實標籤才能計算
- (B) 屬於分類任務的損失函數
- (C) 屬於非監督式學習的內部評估指標，依資料本身結構特徵評估
- (D) 屬於強化式學習的長期累積報酬指標

**答案：(C)**
解析：Reconstruction Error 為內部評估指標之一，依資料本身結構特徵評估（常見於降維後資料還原誤差、自編碼器重建誤差），**不需要外部標籤**。（chunks line 208–214）

---

## 第五部分｜強化式學習（Q23–Q28）

### Q23
強化式學習（Reinforcement Learning, RL）的核心目標為何？
- (A) 最小化模型輸出與實際標籤的誤差
- (B) 從無標註資料中發現潛在結構
- (C) 透過與環境互動學習決策策略，最大化長期累積報酬（Reward）
- (D) 將高維資料降至低維表示

**答案：(C)**
解析：RL 特徵 = 模型透過與環境互動學習決策策略，目標為**最大化長期累積報酬（Reward）**。(A) 是監督式，(B) 是非監督，(D) 是降維。（chunks line 240）

---

### Q24
下列關於馬可夫決策過程（Markov Decision Process, MDP）七要素的描述，何者**錯誤**？
- (A) 代理人（Agent）：執行動作並從經驗中學習的人工智慧
- (B) 環境（Environment）：代理人互動的外部系統
- (C) 報酬（Reward）：代理人於某一時刻觀察到的環境資訊
- (D) 策略（Policy）：代理人根據當前狀態選擇動作的規則

**答案：(C)**
解析：報酬（Reward）= 環境對代理人某行為的**回饋**，用以指引學習方向；題目把它的定義跟「狀態（State）」對調。State 才是「代理人於某時刻觀察到的環境資訊」。（chunks line 248–255）

---

### Q25
下列何者**為**強化式學習中「價值函數（Value Function）」的定義？
- (A) 代理人在特定狀態下可採取的行為
- (B) 衡量某一狀態或狀態 - 動作對的長期獎勵期望值
- (C) 環境對代理人行為的即時回饋
- (D) 代理人根據當前狀態選擇動作的規則

**答案：(B)**
解析：價值函數 = 衡量狀態或狀態-動作對的**長期獎勵期望值**。(A) 是 Action，(C) 是 Reward，(D) 是 Policy — 把 MDP 七要素互換是高頻干擾。（chunks line 254–255）

---

### Q26
下列關於強化式學習任務類型分類的敘述，何者**錯誤**？
- (A) 策略學習（Policy Learning）— 直接學最佳策略，例如策略梯度法（Policy Gradient）
- (B) 價值學習（Value-Based）— 學習狀態或狀態 - 動作對的價值函數，如 Q-learning
- (C) 模型式學習（Model-Based RL）— 完全不需與環境互動即可學習
- (D) 模型無關學習（Model-Free RL）— 無需環境模型、依賴試誤與經驗回放

**答案：(C)**
解析：Model-Based RL 是「**嘗試學環境轉移與回饋機制**」以提升策略更新效率，仍需與環境互動；只是建立內部環境模型輔助。並非「不需互動」。（chunks line 261–274）

---

### Q27
下列何者**並非**教材所列強化式學習評估指標？
- (A) 平均累積報酬（Average Reward per Episode）
- (B) 成功率或任務達成率
- (C) 策略穩定性與收斂速度
- (D) 模型參數總量

**答案：(D)**
解析：教材列三項：Avg Reward per Episode / 成功率 / 策略穩定性與收斂速度；模型參數總量不是 RL 績效指標（屬於模型大小，與策略表現無直接關聯）。（chunks line 292–294）

---

### Q28
教材指出強化式學習實務面臨的挑戰**不包含**下列何者？
- (A) 樣本效率低
- (B) 訓練不穩定
- (C) 缺乏可用 GPU
- (D) 實務部署門檻高

**答案：(C)**
解析：教材列三大挑戰 = 樣本效率低／訓練不穩定／實務部署門檻高；GPU 算硬體資源問題，不在教材討論範圍。（chunks line 308）

---

## 第六部分｜跨範式整合（Q29–Q30）

### Q29
下列關於三大範式對「標註」需求的描述，何者**正確**？
- (A) 三者皆需要人工標註資料
- (B) 監督式需要標註資料；非監督式不需標註；強化式透過與環境互動取得的 Reward 取代傳統標註
- (C) 監督式不需標註；非監督式需要標註；強化式不需任何回饋
- (D) 三者皆不需要任何形式的監督訊號

**答案：(B)**
解析：監督式靠 Labeled Data；非監督式無標註；RL 透過環境回饋 Reward 取代傳統標註 — 三範式對「監督訊號」的形式定義不同。（chunks line 101、162、240、248–253）

---

### Q30
下列關於三大範式典型應用領域的配對，何者**錯誤**？
- (A) 監督式 — 醫療診斷（病患資訊 → 疾病類型）
- (B) 非監督式 — 客戶分群與行為分析
- (C) 強化式 — 自走車與機器人控制
- (D) 強化式 — 影像分類（影像 → 物件類別）

**答案：(D)**
解析：影像分類為**監督式**典型應用（影像 → 已知物件類別）；RL 五大應用 = 遊戲 AI / 自駕車 / 推薦系統 / 金融投資 / 物流排程。（chunks line 154、230、302–306）

---

## 答案速查表

| Q | 答 | Q | 答 | Q | 答 |
|---|---|---|---|---|---|
| 1 | D | 11 | B | 21 | D |
| 2 | C | 12 | B | 22 | C |
| 3 | D | 13 | B | 23 | C |
| 4 | B | 14 | C | 24 | C |
| 5 | C | 15 | C | 25 | B |
| 6 | C | 16 | C | 26 | C |
| 7 | D | 17 | B | 27 | D |
| 8 | B | 18 | D | 28 | C |
| 9 | D | 19 | B | 29 | B |
| 10 | C | 20 | C | 30 | D |

## 命題分布統計

| 章節 | 題號範圍 | 題數 | 對應 prompts | 重點 |
|---|---|---:|---|---|
| 前言／三範式 | Q1–Q3 | 3 | P01 | ML 定義、5 大環節、三範式 |
| 基本結構 | Q4–Q9 | 6 | P02–P07 | 特徵空間、任務目標、模型假設、損失函數、資料分割、評估指標 |
| 監督式學習 | Q10–Q14 | 5 | P08–P12 | 核心目標、訓練 4 階段、典型應用、分類預測機制 |
| 非監督式學習 | Q15–Q22 | 8 | P13–P17 (含 P16b) | 與監督式對比、4 任務、**內部/外部評估指標**、視覺化、應用 |
| 強化式學習 | Q23–Q28 | 6 | P18–P22 | RL 目標、MDP 七要素、任務分類、評估指標、實務挑戰 |
| 跨範式整合 | Q29–Q30 | 2 | 整章 | 標註需求對比、應用領域對比 |
| **合計** | — | **30** | — | — |

## 易混淆考點清單（找混淆提示詞輸出）

| # | 易混淆對 | 差異 |
|---|---|---|
| 1 | Validation Set vs Test Set | Val=調超參+監控過擬合；Test=最終評估（Q8） |
| 2 | F1 vs MAE/MSE/R² | F1=分類；MAE/MSE/R²=迴歸（Q9） |
| 3 | MSE vs Cross-Entropy | MSE=迴歸；Cross-Entropy=分類（Q7） |
| 4 | 監督式 vs 非監督式輸出 | 監督=具體預測值；非監督=分組/降維/潛藏變數（Q15） |
| 5 | 內部 vs 外部評估指標 | 內部=Silhouette/DB/Reconstruction；外部=Rand Index/AMI（Q17/Q18/Q22） |
| 6 | 醫療診斷歸屬 | 監督式（有疾病標籤），非非監督（Q12/Q20/Q30） |
| 7 | 客戶分群歸屬 | 非監督式（無標籤分群），非監督式（Q12/Q20/Q30） |
| 8 | State vs Reward 定義 | State=環境資訊；Reward=回饋（Q24） |
| 9 | Model-Based RL 誤解 | Model-Based 仍需互動，只是另建環境模型（Q26） |
| 10 | 序列決策歸屬 | RL 子類，非非監督任務（Q16） |

---

— 命題：Heiter（2026-05-12）
— 對應投影片版本：L23201 23 頁完整版（含 P16b 評估方法獨立頁）
