## カテゴリ変数のエンコード
- Label Encoding
- カテゴリに対して一意な整数を割り振ります。エンコード後の整数が量的変数としてみなされるようなモデルでは注意する必要があります。
- One-Hot Encoding
- カテゴリの存在を T/F で表現する新しいカラムを作成します。特徴量の次元が増大します。
- Count Encoding
- カテゴリの出現回数に変換します。不均衡なデータであっても、重みを表現しやすいです。
Count Encoder を除く Encoder 各種は Scikit-learn に実装されていますが、自前での実装も可能です。
Label Encoder:
Count Encoder:
記事がありません