某電商企業希望利用自然語言處理(NLP)技術,分析顧客在社群平 台與商品評論中的文字內容,以即時掌握顧客對產品的滿意度變化。 若採用情感分析(Sentiment Analysis)模型,其主要目的為何?
✅ 正確答案:(B) 判斷文本中所表達的情感傾向;
某跨國金融科技公司導入 Transformer架構開發多語客服系統,以提 升長篇金融文件的自動翻譯品質。下列何者為該模型能顯著改善翻譯 準確度的主要原因?
✅ 正確答案:(A) 透過自注意力機制(Self-Attention Mechanism)捕捉長距離語 境依賴關係;
某企業計畫應用 BERT(Bidirectional Encoder Representations from Transformers)模型分析大量顧客意見,以強化客服自動回覆 系統。在 BERT 的預訓練過程中,「遮罩語言模型(Masked Language Model, MLM)」的主要訓練策略為何?
✅ 正確答案:(B) 隨機遮罩部分詞語,並讓模型根據雙向上下文(Bidirectional Context)預測被遮罩的詞;
在詞向量(Word Embedding)訓練方法中,GloVe(Global Vectors for Word Representation)與 Word2Vec的主要差異為何?
✅ 正確答案:(C) Word2Vec 為基於預測的模型,而 GloVe為基於共現統計的模型;
某企業以詞頻–逆文件頻率(Term Frequency–Inverse Document Frequency, TF-IDF)方法分析顧客意見內容,但發現模型在處理篇 幅較長的回饋文本時,無法準確反映關鍵詞的重要性。下列何者為造 成此現象的主要原因?
✅ 正確答案:(A) 長文本中的詞頻偏高,導致常見詞權重被過度放大;
某企業嘗試以 N-gram語言模型(N-gram Language Model)建立客服 自動回覆系統,但發現模型生成的句子雖在片段上合理,卻缺乏整體 語意連貫性。此問題最可能源自 N-gram模型的哪一項限制?
✅ 正確答案:(B) N-gram 模型僅根據固定長度的前序詞建立機率估計,難以捕捉長 距離依賴關係(Long-range Dependencies);
在企業導入的智慧監控系統中,模型以物件偵測(Object Detection)方式自動辨識影像中的人物與車輛。若評估指標採用平 均精確率(Mean Average Precision, mAP),其中 IoU (Intersection over Union)閾值設定較高時,代表下列哪一項意 義?
✅ 正確答案:(A) 預測邊界框與真實邊界框的重疊程度越高,模型偵測結果越精 準;
關於 Softmax 與 Max-Pooling,下列敘述何者正確?
✅ 正確答案:(C) Softmax 會保留所有輸入資訊,但以比例表示;Max-Pooling 只保 留區域最大值;
某企業在訓練生成式 AI模型時,導入資料增強(Data Augmentation)技術以擴充訓練資料,但觀察到模型效能反而下降。 下列哪一項最可能的原因與對應改善策略最為正確?
✅ 正確答案:(B) 增強後資料的特徵分佈與原始資料不一致,影響模型的泛化能 力,應檢查並調整增強策略以維持語意一致性;
如果希望同時兼顧「精確率(Precision)」和「召回率(Recall)」, 下列哪一個指標可以作為綜合評估的標準?
✅ 正確答案:(D) F1分數(F1 Score)
企業資料分析團隊使用 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)演算法進行顧客行為分群,並希望模 型能自動區分主要群集與雜訊資料。 在此演算法中,決定聚類結果的兩個主要超參數為下列何者?
✅ 正確答案:(C) 鄰域半徑(Epsilon ε)與最小點數(MinPts);
某金融科技公司建立房價預測模型,使用多項特徵(如建坪、房齡、 樓層、總價等)進行線性迴歸分析(Linear Regression Analysis)。資料分析師發現多個特徵之間存在高度相關性,導致模 型係數不穩定、預測誤差上升。為解決此問題,下列哪一種方法最適 合?
✅ 正確答案:(B) 使用主成分分析(PCA)將相關特徵轉換為彼此獨立的主成分;
下列何者為 Kubernetes在 AI模型部署與運行中的核心功能?
✅ 正確答案:(B) 管理與協調模型服務的部署、擴展與運行環境;
在調整模型超參數(Hyperparameters)時,若希望避免因過度調整 參數而導致過擬合,下列哪一種做法最有效提升模型的泛化能力?
✅ 正確答案:(A) 採用交叉驗證(Cross-Validation)於多組參數組合間反覆評 估,選擇在驗證資料上表現最穩定的設定;
在企業導入的 MLOps(Machine Learning Operations)流程中, Model Registry 最常用於哪一個階段?
✅ 正確答案:(C) 用於集中管理模型版本、訓練紀錄與部署狀態;
下列哪一種情境中最適合使用「序列到序列(Seq2Seq)」模型?
✅ 正確答案:(D) 將輸入文字轉換成語意等價的另一段文字,如自動翻譯或摘要生 成
在自然語言處理中,檢索增強生成(Retrieval-Augmented Generation, RAG)是一種結合語言模型與向量搜尋的技術,可有效 減少模型知識過時與產生幻覺的問題。若要建立一套高效能的 RAG系 統,下列何者為在「檢索階段」最關鍵的挑戰?
✅ 正確答案:(D) 避免向量檢索結果僅具語意相似但與查詢意圖無實質關聯的情況
當 Transformer 模型發生「注意力分布過於平均(Attention Collapse)」的情形時,導致模型無法有效聚焦於關鍵資訊,下列哪 一項策略可有效改善此問題?
✅ 正確答案:(D) 對注意力權重施加稀疏化約束(Sparsity Constraint)
某研究團隊正在訓練一個針對低資源語言(如少數民族語言)的語言 模型,但該語言僅有約 1萬筆語料可用。在訓練過程中出現明顯的過 擬合現象,若希望在不新增真實語料的前提下提升模型的泛化能力, 採用下列哪一種方法最為適合?
✅ 正確答案:(B) 採用反向翻譯(Back-Translation)技術,以生成額外目標語句 的偽平行語料(Pseudo‑Parallel Corpus);
在使用生成對抗網路(GAN)進行人臉影像生成時,若出現「模式崩 潰」(Mode Collapse)現象,下列哪一種方法最常被用來有效解決此 問題?
✅ 正確答案:(B) 採用 Wasserstein 距離(WGAN 損失)替代原始的 GAN 損失函 數;
在多模態 AI 模型訓練或推論過程中,遇到某一模態資料缺失(例如 僅有影像資料但缺少文本說明),下列哪一種策略最有效維持模型效 能?
✅ 正確答案:(B) 訓練具備模態缺失感知能力的模型,使其適應缺失狀況;
某電商平台開發的顧客流失預測模型在上線數月後,預測準確率明顯 下降。專案團隊懷疑顧客行為模式改變,導致模型輸入特徵的分佈與 原始訓練資料不同,出現典型的資料漂移(Data Drift)問題。為了 偵測並確認資料分佈是否發生變化,下列哪一種作法最合適?
✅ 正確答案:(D) 計算輸入特徵分佈間的 KL散度(KL Divergence)
某大型醫院即將部署一套輔助診斷的 AI系統,為降低對臨床流程的 衝擊,同時確保風險可控與回饋可收斂,應採取何種『漸進式部署』 (Phased Rollout)策略最為合適?
✅ 正確答案:(A) 從單一專科(如放射科)或特定病房開始啟用,逐步擴展至全 院;
某金融機構的 AI風控系統遭受對抗性攻擊,駭客透過對輸入特徵進 行微小但惡意的擾動,成功欺騙了模型。為了從根本上解決模型自身 對這類攻擊的脆弱性,下列何者並非針對此種攻擊型態的技術手段?
✅ 正確答案:(D) 在模型部署環境中強化網路防火牆,以阻擋來自未授權來源的網 路連線
某企業部署生成式 AI系統協助行銷與內容產出,但近期遭質疑部分 生成內容可能涉及著作權侵權。為降低企業在法律層面的潛在責任與 風險,下列哪一項策略最能有效預防侵權問題產生?
✅ 正確答案:(B) 建立訓練資料篩選與授權驗證機制,排除未授權或高風險資料來 源;
在房價預測任務中,若發現特徵如「房間數」與「坪數」存在高度多 重共線性(Multicollinearity),為降低共線性對模型參數估計的負 面影響,應優先選擇下列哪種模型?
✅ 正確答案:(D) 含 L1正則化的 LASSO迴歸模型
某企業需分析半結構化的系統日誌(JSON格式),以提取關鍵的時序 特徵供故障預測模型使用。考量日誌結構複雜且包含巢狀欄位 (Nested Fields),下列哪一種策略最有效且實務可行?
✅ 正確答案:(C) 設計遞迴函式展開巢狀欄位,並基於時間窗口(Time Window)進 行聚合與特徵萃取;
在一個同時包含連續型特徵與類別型特徵的資料集中,若希望透過適 當的特徵工程流程來提升模型整體表現,下列哪一種作法最為合適?
✅ 正確答案:(C) 對連續特徵做標準化(Standardization),類別特徵採用目標編 碼(Target Encoding),並生成交互特徵提升模型表現;
某 AI開發團隊為提升模型開發效率及品質控制,計畫實施持續整合 (Continuous Integration, CI)流程。下列哪一項做法最符合 CI 的核心實踐,且能有效減少整合風險?
✅ 正確答案:(B) 每次程式碼提交(Commit)後自動觸發建置、單元測試及靜態程 式碼分析;
某銀行計劃將 AI詐欺偵測模組整合至核心交易系統,主管機關要求 全流程必須符合金融監管對「不可否認性(Non-repudiation)」的資 訊安全規範,以確保日後能進行法務追蹤與稽核。下列哪一項措施最 能確保此要求的落實?
✅ 正確答案:(A) 為每筆 AI模型推論記錄其輸入與輸出結果的加密雜湊值 (Hash),並簽署數位簽章以確保不可竄改性;
某 AI服務系統每次推論請求需約 1秒完成,且必須支撐高達 10,000 次請求每秒(RPS)的流量。為確保系統具備高可用性且能穩定應付 流量峰值,下列哪一種架構方案最為合適?
✅ 正確答案:(B) 採用容器化部署並水平擴展服務實例,結合自動彈性伸縮機制 (Auto Scaling);
某企業已將 AI模型部署於生產環境,為確保系統持續穩定運作,並 能提前偵測模型效能可能衰退,技術團隊希望透過監控指標進行預 警。 下列哪一項監控指標最具預測效力,能提早發現模型效能下滑風險?
✅ 正確答案:(D) 輸入特徵與訓練資料分布差異的 PSI(Population Stability Index)指數
企業團隊在使用 Word2Vec模型訓練客服文本語料時,若訓練資料量 龐大且希望模型能更有效捕捉罕見詞的語意關聯,下列哪一種訓練策 略最為適合?
✅ 正確答案:(C) 採用 Skip-gram模型,利用中心詞預測周圍詞語,能更有效學習 低頻詞關係;
在自駕車影像辨識系統中,開發團隊希望模型能同時辨識每個像素所 屬的物件類別(例如道路、建築、行人),又能區分出同類物件的不 同個體(例如多位行人)。此時最適合採用下列哪一項電腦視覺技 術?
✅ 正確答案:(D) 全景分割(Panoptic Segmentation)
某媒體公司計畫導入 CLIP(Contrastive Language–Image Pre- training)模型,以協助大量影像自動標註與搜尋,並希望在無需新 增標訓資料的情況下,僅透過文字提示(Text Prompt)即可識別影 像內容。請問此應用情境中,CLIP能夠達成的關鍵技術特性為何?
✅ 正確答案:(A) 透過圖文對比式學習(Contrastive Learning)將影像與文字映 射至共同嵌入空間(Shared Embedding Space),可直接以語意相似 度進行零樣本分類;
某資料科學團隊在開發預測模型時,針對多種模型設定(如學習率、 樹深度、正則化係數等)進行系統化測試,希望找出在驗證資料上表 現最穩定的組合。此過程最可能採用下列哪一種方法?
✅ 正確答案:(B) 透過網格搜尋(Grid Search)在多組超參數設定中進行系統化搜 尋與評估;
某公司正在訓練一個大型語音合成模型,開發團隊使用多台 GPU 進行 訓練,但經常出現 GPU 記憶體不足問題。由於模型架構已固定且無 法更換硬體,團隊希望在維持模型效能與收斂品質的前提下,下列哪 一種方法最有效降低單張 GPU 的記憶體壓力?
✅ 正確答案:(B) 採用較小的批次大小(Batch Size)並搭配資料分片(Data Sharding)分散訓練負載;
某影像設計團隊在使用 Stable Diffusion生成 4K級產品圖時,發現 影像邊緣與細節存在顆粒化與模糊現象。 若僅能在生成階段進行調整,希望提升畫面清晰度與紋理層次,同時 避免過度平滑,下列哪一項作法最適合?
✅ 正確答案:(B) 增加取樣步數並選擇高品質取樣器,以強化細節還原度;
某企業的資料科學團隊利用 ARIMA模型(AutoRegressive Integrated Moving Average Model)預測每週產品銷售量。模型建 立完成後,分析人員發現預測誤差隨時間呈現週期性波動,且自相關 函數(ACF)顯示殘差在多個時滯(Lag)上仍顯著不為零。根據上述 現象,最合理的模型診斷結論為何?
✅ 正確答案:(C) 模型存在配適不足(Underfitting)問題,需重新調整 p 或 q 參數以捕捉時間依賴性;
下列哪一項最正確地描述了 VAE(Variational Autoencoder)、GAN (Generative Adversarial Network)與擴散模型(Diffusion Model)在多模態潛在空間對齊(Latent Alignment)與生成策略上 的根本差異?
✅ 正確答案:(A) VAE透過顯式潛在變數建模實現跨模態對齊,適合捕捉整體語意結 構但生成解析度有限;GAN透過對抗損失(Adversarial Loss)在不 同模態間學習分佈映射,生成品質高但穩定性差;擴散模型則以條件 化噪聲反推(Conditional Denoising)方式實現高保真跨模態生 成,兼具穩定性與多樣性;
在進行超參數調校(Hyperparameter Tuning)時,若直接在 K-Fold 交叉驗證(Cross-Validation)的資料上同時調整模型參數並評估效 能,最可能導致下列哪一種問題?
✅ 正確答案:(A) 模型的交叉驗證結果出現過度樂觀偏差(Over-optimistic Bias),因測試摺資料間接參與參數選擇,造成資料洩漏(Data Leakage);
若部署一個深度學習模型至金融風控系統,該模型採用鑑別式架構 (如 Transformer Classifier)。然而上線後,模型對新樣本的分類 錯誤率顯著上升,經檢查發現,輸入資料分佈已與原訓練集明顯不 同。針對此情形,下列哪一種應對策略最為適合?
✅ 正確答案:(D) 使用變分自編碼器(VAE)監控潛在空間分佈,偵測輸入資料偏移
某金融科技公司欲導入 AI模型協助客服郵件自動分類(投訴、詢 問、表揚)。團隊同時考慮兩種模型設計: 方案 A(生成式路徑):採用 VAE建構潛在語意空間,再結合下游分 類器進行標籤預測; 方案 B(鑑別式路徑):採用 BERT Classifier 直接根據輸入文本進 行監督式分類。 現有標註資料約 2,000 筆,資料分佈均勻但擴充成本高。若團隊希 望公平比較兩種模型的資料利用效率與泛化能力,下列哪一種實驗設 計最能突顯兩者的本質差異?
✅ 正確答案:(B) 在低資源情境(Low-resource Setting)下,逐步減少標註比例 (100%、50%、10%),比較其 F1-score;
某電信公司希望建立一個模型來預測顧客是否即將流失,並進一步模 擬不同促銷或服務策略下顧客的行為變化,以生成多樣化的虛擬樣本 資料進行 A/B 測試與行銷策略評估。若要同時兼顧預測與資料生成的 需求,最適合採用下列哪一種方法?
✅ 正確答案:(C) 使用變分自編碼器(Variational Autoencoder, VAE)或生成對 抗網路(Generative Adversarial Network, GAN);
進行影像分類任務時,研究團隊嘗試利用主成分分析(Principal Component Analysis, PCA)將輸入特徵從 1024維降至 100維,並將 降維後的資料輸入支持向量機(Support Vector Machine, SVM)模 型進行訓練。關於此作法,下列哪一項描述最為合理?
✅ 正確答案:(D) 降維後可降低訓練時間並減少過擬合(Overfitting)風險
某企業的 AI 模型已部署於線上服務環境中,用於即時預測顧客流失 機率。近期團隊注意到模型預測準確率逐漸下降,但系統運作正常且 未出現錯誤訊息。經分析發現,近期輸入資料的分布與模型訓練資料 相比出現顯著偏移。若要在 MLOps流程中主動偵測並預警此類問題, 最應採用下列哪項措施?
✅ 正確答案:(A) 建立即時的資料漂移(Data Drift)與概念漂移(Concept Drift)監測機制;
某金融科技公司導入多任務學習架構,讓單一 Transformer 模型同 時執行 OCR(Optical Character Recognition)後的文檔分類以及命 名實體辨識(Named Entity Recognition, NER)任務, 以協助自動歸檔與抽取關鍵金融資訊。在部署初期,團隊發現當模型 的 NER準確率(Accuracy)提升時,文檔分類準確率反而下降。若模 型架構正確且資料品質良好,下列哪一項最可能是造成此現象的原 因?
✅ 正確答案:(C) 損失函數(Loss Function)未進行權重平衡,導致任務間競爭;
某數據工程師使用 DBSCAN演算法對一份數百萬筆的高維顧客資料進 行聚類分析,但發現程式執行速度極慢,甚至出現記憶體不足的情 況。若要在不改變演算法核心邏輯的前提下,最有效提升其運算效率 的作法為何?
✅ 正確答案:(B) 採用高效率的距離索引結構(Distance Index Structure),例如 KD-Tree 或 Ball Tree;
某電商平台導入 AI情感分析模型,用以自動偵測顧客評論中的負面 情緒並觸發客服機制。然而,上線後發現模型在面對不同語言或族群 書寫風格的評論時表現不一致,例如部分語氣強烈的正面評論被誤判 為負面,而禮貌但含批評意圖的評論卻被判為中性。若從技術與資料 治理的角度分析,下列哪一項描述不正確?
✅ 正確答案:(A) 模型未啟用詞嵌入正規化(Embedding Normalization)可能造成 語意距離不穩定,導致預測誤差;
某設計師使用公司內部建置的生成式 AI工具製作行銷素材,並輸入 提示語(Prompt):「請生成一張模特兒手持品牌飲料、背景為海邊夕 陽的照片」。系統能正確生成主要主題與場景,但輸出的圖像中,品 牌標誌顏色常有誤差,或人物手部姿勢顯得不自然。若從多模態生成 模型的技術機制分析,此現象最可能是下列哪一項原因所造成?
✅ 正確答案:(C) CLIP 模型中的文字編碼器與影像編碼器在語意嵌入空間未充分對 齊,導致跨模態理解偏差;