Awesome-omni-skill feature-engineering

モデルの性能を向上させるために、既存のデータから新しい特徴量を作成する。

install
source · Clone the upstream repo
git clone https://github.com/diegosouzapw/awesome-omni-skill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/diegosouzapw/awesome-omni-skill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/product/feature-engineering" ~/.claude/skills/diegosouzapw-awesome-omni-skill-feature-engineering && rm -rf "$T"
manifest: skills/product/feature-engineering/SKILL.md
source content

Feature Engineering

概要

モデルの性能を向上させるために、既存のデータから新しい特徴量を作成する。

手順

  1. ドメイン知識の適用: ビジネスロジックに基づいた特徴量作成。
  2. 変換: 対数変換、Box-Cox変換、標準化/正規化。
  3. エンコーディング: One-Hot Encoding, Label Encoding, Target Encoding.
  4. 相互作用: 変数間の掛け合わせ、割り算。
  5. 集約: グループごとの統計量(平均、最大、最小、分散など)の算出。
  6. 時系列特徴量: ラグ特徴量、移動平均など(時系列データの場合)。

使用ツール・ライブラリ

  • pandas, numpy, scikit-learn

成果物の保存場所

  • 特徴エンジニアリング、学習、検証用ノートブック:
    project/src/03_main.ipynb
  • 特徴量エンジニアリング用コード:
    project/src/modules/feature_engineering.py
  • 特徴量生成後のデータセット:
    project/data/[元データ名]-feature_engineered.csv
  • 実験結果ログ:
    project/reports/experiment/[番号]-[アプローチの概要].md