數位花園首頁 - 特徵工程筆記

歡迎來到我的數位花園!

這裡是我關於特徵工程的學習筆記集。特徵工程是機器學習中非常重要的一環,能夠極大地影響模型的性能。以下是我目前的筆記:

特徵編碼方法

  1. One-hot encoding
    • 將類別變數轉換為二進制向量
    • 適用於名義變數,不引入順序關係
  2. Ordinal encoding
    • 將類別變數轉換為整數
    • 適用於有序變數,但可能引入不當的順序關係
  3. Mean encoding
    • 使用目標變量的平均值替換類別
    • 可捕捉類別與目標之間的關係,但需要謹慎處理以避免數據洩露
  4. Feature encoding comparison
    • 比較不同編碼方法的優缺點
    • 討論如何選擇適合的編碼方法

探索更多

這只是開始!我會持續更新和擴展這些筆記。如果你有任何建議或問題,歡迎與我討論。

Happy learning! 🌱

This line appears after every note.

Notes mentioning this note

There are no notes linking to this note.


Here are all the notes in this garden, along with their links, visualized as a graph.

數位花園首頁 - 特徵工程筆記Feature Encoding ComparisonMean EncodingOne Hot EncodingOrdinal Encoding