# HANDOFF — L21101 自然語言處理技術與應用 首波生圖（共 31 張）

> 日期：2026-05-09
> 派工人：Heiter
> 目標：output4 試做章節 L21101 第一波 31 張生圖（仿科目三 output3 標準）
> 圖檔規格：16:9 / 2048x1152 / 繁體中文清楚可讀
> 風格：手寫講義筆記（淡米白方格紙、黑色粗手寫標題、青綠底線、暖黃重點框、紅橘標註、多色手繪圓圈編號）

## 鎖死規則

1. **第一波生圖無 `_v` 後綴**（首次生圖，從零開始）
2. PNG 輸出到：`/Users/kueikuei/aiondaily/ipas_AI規劃師中級/科目一_學習指引_分章_v4/output4/L21101_自然語言處理技術與應用/images/`
3. 三個共通負向約束：嚴禁畫成 L21102 / L21103 / L21201 / L21202 / L21203 / L21204 章節 / 嚴禁過頁鉤子 / 嚴禁右上角頁碼

## 共用變數

```
L_CODE = "L21101"
STYLE_BASE = "請生成一張 16:9、2048x1152 的高解析手寫講義筆記風格投影片，繁體中文必須清楚可讀。背景使用淡米白色方格筆記紙與細方格線。左上角只將 L-code 以淡灰色小字標示，不要加任何框框或底線。不要加入任何右上角頁碼。右下角浮水印「AIOnDaily × 咖啡AI學」，透明度約 35%，像印在紙上並保留安全邊距。整體要活潑、像手寫講義筆記，不要卡片式資訊圖。使用黑色粗手寫標題、青綠底線、暖黃色重點框、紅橘標註、多色手繪圓圈編號與小 icon。所有英文縮寫保留清楚字距。"
LAYOUT_RULE = "版面要有明確主視覺、2 到 4 個重點區塊、少量關鍵詞與箭頭關係，保留舒適留白。避免密密麻麻小字；公式若出現，請以手寫公式框呈現並保持符號正確。"
```

## 執行原則

每張 prompt 直接從 `output4/L21101_自然語言處理技術與應用/prompts.md` 對應 P 區段**原文照抄全段**送 codex（含 TERMS_RULE 覆寫 + 變數展開 + 三個共通負向約束）。

每張 prompt 開頭附三個共通負向約束：

```
【共通負向約束】
1. 嚴禁畫成 L21102「電腦視覺技術與應用」、L21103「生成式 AI 技術與應用」章節 — 本章是 L21101 自然語言處理技術與應用，左上 L-code 寫「L21101」。
2. 嚴禁畫成 L21201/L21202/L21203/L21204 等大數據處理章節，亦非 L23xxx 機器學習章節。
3. 嚴禁出現任何過頁鉤子文字（「見 PXX」「→ 下一節」等指向其他頁面的字樣）。
4. 嚴禁出現右上角頁碼。
```

## 31 張清單

| # | 動作 | 檔名 | 主題 |
|---|---|---|---|
| 1 | 新增 | `L21101_p01_intro_overview.png` | 1. 前言與章節導覽（**含「第 3.1 節 · 自然語言處理技術與應用」教材編號 banner，本頁限定**）|
| 2 | 新增 | `L21101_p02_section2_concept_evolution_overview.png` | 2. NLP 基礎概念與發展脈絡（章節導讀）|
| 3 | 新增 | `L21101_p03_definition_three_task_levels.png` | 2.（1）定義與範疇 — NLP 三任務層次 |
| 4 | 新增 | `L21101_p04_nlp_nlu_nlg_relationship.png` | 2.（1）NLP / NLU / NLG 三層分工關係表 |
| 5 | 新增 | `L21101_p05_evolution_four_stages.png` | 2.（2）技術演進脈絡 — 四階段總覽 |
| 6 | 新增 | `L21101_p06_rule_based_methods.png` | 2.（2）A 規則式方法（1980s–1990s）|
| 7 | 新增 | `L21101_p07_statistical_lm.png` | 2.（2）B 統計語言模型（1990s–2010s）|
| 8 | 新增 | `L21101_p08_deep_learning_era.png` | 2.（2）C 深度學習時代（2010s）|
| 9 | 新增 | `L21101_p09_pretrained_lm.png` | 2.（2）D 預訓練語言模型（2018–至今）|
| 10 | 新增 | `L21101_p10_section3_preprocessing_overview.png` | 3. NLP 前處理（章節導讀）|
| 11 | 新增 | `L21101_p11_tokenization.png` | 3.（1）分詞（Tokenization）|
| 12 | 新增 | `L21101_p12_pos_tagging.png` | 3.（2）詞性標注（POS Tagging）|
| 13 | 新增 | `L21101_p13_lemmatization_stemming_stopwords.png` | 3.（3）詞形還原與詞幹提取（含停用詞移除）|
| 14 | 新增 | `L21101_p14_section4_key_models_overview.png` | 4. NLP 關鍵技術與常用模型（章節導讀）|
| 15 | 新增 | `L21101_p15_key_tech_three_concepts.png` | 4.（1）NLP 關鍵技術發展總覽 — 三層概念入口 |
| 16 | 新增 | `L21101_p16_contextual_vs_noncontextual.png` | 4.（1）A 語境型 vs 非語境型表示 |
| 17 | 新增 | `L21101_p17_distributed_vs_nondistributed.png` | 4.（1）B 分布式 vs 非分布式表示 |
| 18 | 新增 | `L21101_p18_onehot_bow.png` | 4.（1）C 詞嵌入入門 — One-hot Encoding & Bag of Words |
| 19 | 新增 | `L21101_p19_tfidf.png` | 4.（1）C TF-IDF（含公式三條 + 示例計算）|
| 20 | 新增 | `L21101_p20_ngram.png` | 4.（1）C N-gram 語言模型（含 Bi-grams/Tri-grams 示例）|
| 21 | 新增 | `L21101_p21_word2vec_cbow_skipgram.png` | 4.（1）C Word2Vec（CBOW + Skip-gram + king-man+woman≈queen）|
| 22 | 新增 | `L21101_p22_glove_fasttext.png` | 4.（1）C GloVe / FastText 兩方法並列 |
| 23 | 新增 | `L21101_p23_rnn_lstm_gru_comparison.png` | 4.（2）深度學習在 NLP — RNN / LSTM / GRU 比較 |
| 24 | 新增 | `L21101_p24_transformer_self_attention.png` | 4.（2）Transformer 核心架構（Self-Attention + Encoder-Decoder + 全平行）|
| 25 | 新增 | `L21101_p25_elmo_bert_gpt.png` | 4.（3）預訓練語言模型 — ELMo / BERT / GPT |
| 26 | 新增 | `L21101_p26_prompt_rag_lora.png` | 4.（3）Prompt-based + Few/Zero-shot + RAG / LoRA |
| 27 | 新增 | `L21101_p27_section5_applications_overview.png` | 5. NLP 應用情境與案例（章節導讀，六類入口）|
| 28 | 新增 | `L21101_p28_six_application_cases.png` | 5. NLP 六類應用實例（**6 區獨立卡片不強行 3×2 對齊**）|
| 29 | 新增 | `L21101_p29_section6_risks_overview.png` | 6. NLP 技術挑戰與風險（章節導讀，三層風險入口）|
| 30 | 新增 | `L21101_p30_data_layer_risks.png` | 6.（1）資料層風險 — 隱私 / 標註品質 / 授權版權（含去識別化 vs 匿名化技術差異）|
| 31 | 新增 | `L21101_p31_model_application_risks.png` | 6.（2）模型層 + 6.（3）應用層風險（含「**法國的首都在柏林**」模型幻覺紅橘大型重點框）|

## 工作分配建議（8 worker 並行加速）

- Worker A（2 張前言+§2 導讀）：P01 / P02
- Worker B（4 張 §2 演進）：P03 / P04 / P05 / P06
- Worker C（3 張 §2 後段+§3 導讀）：P07 / P08 / P09
- Worker D（4 張 §3 前處理）：P10 / P11 / P12 / P13
- Worker E（4 張 §4 概念入口）：P14 / P15 / P16 / P17
- Worker F（4 張 §4 詞嵌入前段）：P18 / P19 / P20 / P21
- Worker G（5 張 §4 詞嵌入後段+深度+預訓練）：P22 / P23 / P24 / P25 / P26
- Worker H（5 張 §5+§6）：P27 / P28 / P29 / P30 / P31

預估 40-50 min（8 並行）。

## 各頁特殊要求（重點記）

### P01 章節 banner（限本頁）
- 版面最上方畫淺青色或淺薄荷綠 banner 橫貫全寬（高度約佔 12-15%），banner 中央粗手寫體寫「**第 3.1 節 · 自然語言處理技術與應用**」
- banner 僅在 P01 出現，後續 P02-P31 不重複此 banner

### P02 / P10 / P14 / P27 / P29 五個章節導讀頁
每頁要有「章節主題大字 + 子節入口卡片網格」：
- P02 §2 子節入口：(1) 定義與範疇 / (2) 技術演進脈絡（兩入口）
- P10 §3 子節入口：(1) 分詞 / (2) 詞性標注 / (3) 詞形還原與詞幹提取（三入口）
- P14 §4 子節入口：(1) NLP 關鍵技術發展 / (2) 深度學習在 NLP / (3) 預訓練語言模型（三入口）
- P27 §5 子節入口：六類應用（文字分類 / 情感分析 / 對話系統 / 文字生成 / 機器翻譯 / NER+關係抽取）
- P29 §6 子節入口：三層風險（資料層 / 模型層 / 應用層）

### P28 六類應用頁
- 6 區獨立卡片不強行 3×2 對齊
- 教材原文六類分區：文字分類（垃圾郵件/商品評論/客戶服務）/ 情感分析（社群輿情/顧客滿意度）/ 對話系統（任務導向 vs 開放式如 ChatGPT）/ 文字生成（新聞摘要/廣告標題/自動報表）/ 機器翻譯（商業文件/客服支援/文化交流）/ 其他應用 NER + 關係抽取

### P30 資料層風險
按教材三項：(1) 資料隱私（含去識別化 De-identification 與匿名化 Anonymization 技術差異，含 Pseudonymization / Generalization / Masking / Randomization / Aggregation 五方法）/(2) 標註與品質（含資料偏見 Data Bias）/(3) 資料授權與版權

### P31 模型層+應用層風險
模型層（語意理解挑戰/常識推理/部署與維運）+ 應用層（生成內容風險/**模型幻覺 Model Hallucination 重點舉例「法國的首都在柏林」紅橘大型重點框** / 敏感話題 / 事實檢查機制 / 審核機制）

## 自驗報告（艾冉跑完回報三件事）

1. 31 張全到位（檔名一字不差，全部無 `_v` 後綴）
2. 風險張清單（主題誤植 / 過頁鉤子 / 頁碼出現等）
3. 7 個關鍵 fix 是否生效：
   - (a) P01 章節 banner 寫「第 3.1 節 · 自然語言處理技術與應用」（不是 3.2 不是 3.3），後續 P02-P31 沒有重複 banner
   - (b) 每頁主標題帶教材編號（「2.（1）」「2.（2）A」「3.（1）」「4.（1）C」「6.（1）」等對齊教材原文）
   - (c) P02/P10/P14/P27/P29 五個章節導讀頁有清楚子節入口
   - (d) P28 六類應用獨立卡片不強行 3×2 對齊
   - (e) P30 含去識別化（Pseudonymization/Generalization/Masking）vs 匿名化（Randomization/Aggregation）技術差異
   - (f) P31 含模型幻覺「法國的首都在柏林」教材原文紅橘大型重點框
   - (g) 全部頁面：左上 L-code「L21101」/ 右上空白 / 右下浮水印「AIOnDaily × 咖啡AI學」/ 無過頁鉤子文字

---

**Heiter 派工 done。**
