數位花園首頁 - 特徵工程筆記
歡迎來到我的數位花園!
這裡是我關於特徵工程的學習筆記集。特徵工程是機器學習中非常重要的一環,能夠極大地影響模型的性能。以下是我目前的筆記:
特徵編碼方法
-
One-hot encoding
- 將類別變數轉換為二進制向量
- 適用於名義變數,不引入順序關係
-
Ordinal encoding
- 將類別變數轉換為整數
- 適用於有序變數,但可能引入不當的順序關係
-
Mean encoding
- 使用目標變量的平均值替換類別
- 可捕捉類別與目標之間的關係,但需要謹慎處理以避免數據洩露
-
Feature encoding comparison
- 比較不同編碼方法的優缺點
- 討論如何選擇適合的編碼方法
探索更多
這只是開始!我會持續更新和擴展這些筆記。如果你有任何建議或問題,歡迎與我討論。
Happy learning! 🌱
This line appears after every note.
Notes mentioning this note
There are no notes linking to this note.