商帖小記 SomeTips: 04/06/26

機器學習技術與應用 | 單元 5.3 核心主題解析

快速導覽：

一、資料集切分：三段論法必考觀念

為了確保模型的泛化能力，我們不能在「看過」的資料上評估模型。

應試陷阱：

測試集絕對不能參與模型的訓練或參數選擇！如果測試集的結果反過來影響了參數調整，這稱為「資料洩露 (Data Leakage)」，會導致評估結果過於樂觀。

當資料量不足或需要更穩定的評估時，必須使用特殊的驗證技巧。

作法： 將資料均分為 K 份，輪流拿 1 份當驗證集、其餘 K-1 份當訓練集。最後取平均效能。

優點： 降低單次切分資料造成的隨機誤差，對小樣本特別有用。

場景： 用於資料 「類別不平衡」 時。例如信用卡詐騙案件極少，分層採樣可確保訓練集與驗證集中的詐騙比例與原資料一致。

這是考試中最常出現計算題的地方，必須熟記混淆矩陣 (Confusion Matrix)。

指標	公式	白話解釋
準確率 (Accuracy)	$(TP+TN) / Total$	全部預測對的比例（資料不平衡時無效）。
精確率 (Precision)	$TP / (TP+FP)$	預測為真裡面，有多少是真的？（別誤殺）
召回率 (Recall)	$TP / (TP+FN)$	實際上為真裡面，有多少被抓出來？（別放過）
F1-Score	$2 \times \frac{Pre \times Rec}{Pre + Rec}$	精確與召回的「調和平均」，綜合評價。

ROC 曲線與 AUC 指標：

ROC： 橫軸是偽陽率 (FPR)，縱軸是真陽率 (TPR)。
AUC： ROC 曲線下的面積。AUC = 1 是完美模型；AUC = 0.5 是隨機猜測。**AUC 的優點是不受分類閾值 (Threshold) 影響。**

當目標是連續數字（如房價）時，使用的指標與分類不同。

模型在線上運行一段時間後，效能會下降，這需要持續監控。