📝 測驗說明與操作指南
- 作答方式:請閱讀題目後,直接點擊下方您認為正確的選項((A), (B), (C), (D))。
- 即時判定:點擊選項後,系統會立即判定對錯。若答對,系統會顯示綠色提示;若答錯,系統會標示紅色,並為您標出真正的正確答案。
- 觀看解析:作答完成後,選項下方會自動展開詳細的觀念解析,幫助您釐清知識點。
✅ 答對了!
❌ 答錯了!
💡 解析:np.dot 是 NumPy 中用來正確計算兩個一維陣列內積的標準函式。
✅ 答對了!
❌ 答錯了!
💡 解析:均方誤差(MSE)為誤差平方和的平均值,此語法正確映射了先算差的平方、再求平均的數學公式。
✅ 答對了!
❌ 答錯了!
💡 解析:在統計學上,50% 的百分位數(Percentile)即代表將資料一分為二的中位數(Median)。
✅ 答對了!
❌ 答錯了!
💡 解析:全連接層的參數數量公式為「(輸入維度 + 1) * 輸出維度」,其中的 1 即為偏差項。因此 (10 + 1) * 5 = 55。
✅ 答對了!
❌ 答錯了!
💡 解析:Dropout 會在訓練階段以指定機率隨機丟棄(設為0)神經元的輸出,以此強迫模型不依賴單一特徵,學習更強健的表示。
✅ 答對了!
❌ 答錯了!
💡 解析:將模型層的 trainable 屬性設為 False,可阻止該層在反向傳播時計算梯度並更新權重,完成權重凍結。
✅ 答對了!
❌ 答錯了!
💡 解析:這是標準防洩漏的做法。訓練集負責計算並記住均值與標準差,測試集僅依賴訓練集的參數進行轉換,以模擬完全未知的真實資料。
✅ 答對了!
❌ 答錯了!
💡 解析:isnull() 會將遺漏值轉換為 True(數值1),非遺漏值轉換為 False(數值0),搭配 sum() 可以精準加總出每一欄包含的缺失值總數。
✅ 答對了!
❌ 答錯了!
💡 解析:在 Scikit-learn 的 PCA 中,當 n_components 設為小於 1.0 的浮點數時,演算法會自動判斷需幾個主成分才能解釋指定比例(如 95%)的變異量。
✅ 答對了!
❌ 答錯了!
💡 解析:pd.melt() 專門用於將多欄資料「融化」轉換為兩欄式(變數名稱與數值)的長格式,這對於適配 Seaborn 的繪圖邏輯尤為重要。
✅ 答對了!
❌ 答錯了!
💡 解析:當標籤採用 One-Hot 編碼的多維矩陣形式時,categorical_crossentropy 是相對應且標準的多類別分類損失函數。
✅ 答對了!
❌ 答錯了!
💡 解析:cv=5 代表 5 折交叉驗證,演算法會確保每一份資料都有一次機會成為驗證集,另外四次成為訓練集,這是評估模型泛化穩定度的標準做法。
✅ 答對了!
❌ 答錯了!
💡 解析:np.exp 是 NumPy 計算歐拉數(Euler's number)指數 e 的正確方法,此語法完美映射了數學公式,並能針對整個陣列向量化運算。
✅ 答對了!
❌ 答錯了!
💡 解析:boxplot(箱型圖)利用四分位數完美封裝了資料的分佈特徵,能同時在一張圖上比較多個類別的集中趨勢與異常離群值。
✅ 答對了!
❌ 答錯了!
💡 解析:Scikit-learn 預期輸入特徵 X 是一個二維矩陣 (n_samples, n_features)。使用 reshape(-1, 1) 會保持樣本數不變,但強制為其增加一個特徵維度(轉為單列的矩陣),成功解決報錯。
✅ 答對了!
❌ 答錯了!
💡 解析:random_state 能設定虛擬亂數產生器的種子(Seed),只要給定相同的整數值,就能保證每次隨機切分的結果完全一致,是實驗重現的關鍵參數。
✅ 答對了!
❌ 答錯了!
💡 解析:patience(耐心值)決定了我們願意容忍模型幾個 epoch 效能不再進步才終止訓練。這樣既能防止過擬合,又不會因為單次的效能震盪而過早結束。
✅ 答對了!
❌ 答錯了!
💡 解析:Pipeline 可以將資料前處理與預測模型打包成單一物件。在交叉驗證的每一折中,它會確保僅用當下的訓練折擬合前處理參數,徹底避免測試集資料洩漏。
✅ 答對了!
❌ 答錯了!
💡 解析:pd.get_dummies() 能自動識別類別型變數,並將其快速展開為多個 0 和 1 的布林/數值特徵欄位,是進行獨熱編碼最便捷的 Pandas 方法。
✅ 答對了!
❌ 答錯了!
💡 解析:召回率衡量的是「實際有問題的樣本中,被正確抓出多少」。數值低代表許多患病者被判定為健康而漏診,這在醫療或風控上代價極高。
沒有留言:
張貼留言