Skills csv-wizard

交互式数据清洗 CLI,支持自动类型推断、缺失值处理、重复检测

install
source · Clone the upstream repo
git clone https://github.com/openclaw/skills
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/antonia-sz/csv-wizard" ~/.claude/skills/openclaw-skills-csv-wizard && rm -rf "$T"
OpenClaw · Install into ~/.openclaw/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/openclaw/skills "$T" && mkdir -p ~/.openclaw/skills && cp -r "$T/skills/antonia-sz/csv-wizard" ~/.openclaw/skills/openclaw-skills-csv-wizard && rm -rf "$T"
manifest: skills/antonia-sz/csv-wizard/SKILL.md
source content

CSV Wizard — 交互式数据清洗工具

强大的 CSV 数据清洗和转换工具,提供自动类型推断、缺失值处理、重复检测等功能。

功能特性

  • 🔍 自动类型推断(数字、日期、布尔值、分类变量)
  • 🧹 缺失值检测与多种填充策略
  • 📊 数据统计摘要与预览
  • 🔄 重复行检测与删除
  • 📝 列名标准化与重命名
  • 🎯 数据格式转换与导出

使用方法

基本清洗

/clean-csv data.csv --output clean-data.csv

交互式清洗(推荐)

/clean-csv data.csv --interactive

预览数据信息

/clean-csv data.csv --info

处理缺失值

/clean-csv data.csv --fill-missing mean --output result.csv

删除重复行

/clean-csv data.csv --drop-duplicates --output result.csv

选项说明

选项说明
--info
显示数据基本信息
--preview
预览前 N 行数据
--fill-missing
缺失值填充策略(drop/mean/median/mode/constant)
--drop-duplicates
删除重复行
--standardize-names
标准化列名(snake_case)
--interactive
交互式模式
--output
输出文件路径

缺失值填充策略

  • drop
    - 删除包含缺失值的行
  • mean
    - 使用列均值填充(仅数值列)
  • median
    - 使用中位数填充(仅数值列)
  • mode
    - 使用众数填充
  • constant
    - 使用固定值填充(需配合
    --fill-value

示例

# 查看数据摘要
/clean-csv sales.csv --info

# 清洗数据:删除重复行 + 填充缺失值
/clean-csv sales.csv --drop-duplicates --fill-missing median --output clean-sales.csv

# 交互式清洗
/clean-csv data.csv --interactive

# 仅标准化列名
/clean-csv data.csv --standardize-names --output output.csv

输出说明

清洗后的 CSV 文件将保留原始格式,同时:

  • 自动处理编码问题(统一为 UTF-8)
  • 移除首尾空格
  • 标准化布尔值(True/False)