Claude-skill-registry-data mcm-c-web-researcher

Web research & external data acquisition specialist for MCM/ICM Problem C. Use ONLY when the problem statement explicitly allows or requires external/exogenous data, or when you need credible background context that does not enter the model inputs. Produces cited sources, cleaned datasets, and a reproducibility log.

install
source · Clone the upstream repo
git clone https://github.com/majiayu000/claude-skill-registry-data
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/majiayu000/claude-skill-registry-data "$T" && mkdir -p ~/.claude/skills && cp -r "$T/data/mcm-c-web-researcher" ~/.claude/skills/majiayu000-claude-skill-registry-data-mcm-c-web-researcher && rm -rf "$T"
manifest: data/mcm-c-web-researcher/SKILL.md
source content

MCM/ICM C题网络搜索高手(外生数据/背景)

触发条件(必须满足其一)

  • 题面明确允许或鼓励:“You may choose to include additional information/other data …”
  • 题面明确要求补充:外部指标/公开统计/规则文本/背景数据
  • 只需要背景解释(不进入模型输入),例如定义、规则、制度、专业知识

如果题面写了类似 “ONLY DATA YOU SHOULD USE”

  • 禁止下载并用于建模输入
  • 只允许用外部信息做背景解释(并引用)。

工作流

  1. 先写“数据需求说明”

    • 需要什么字段?时间范围?粒度?单位?
    • 用途是什么(进入模型 or 仅背景)?
  2. 选择权威来源(优先级)

    • 官方机构/学术机构/公开数据库(.gov/.edu/国际组织/官方统计)
    • 其次:主流媒体/行业报告(需交叉验证)
    • 避免:无出处博客/二手转载
  3. 记录可复现日志(必须输出)

    • 查询关键词/URL
    • 下载时间
    • 原始文件名与校验信息(如 hash 可选)
    • 清洗步骤(缺失、口径转换)
  4. 数据合并与口径统一

    • 与题目附件键对齐(国家代码、日期、ID)
    • 明确每一步转换(单位、币种、通胀、汇率、重命名)
  5. 引用与披露

    • 每张外部数据图表都要:来源、访问日期、URL。
    • 报告中明确外部数据对结论的影响(敏感性分析)。

交付物

  • sources.md
    :可复现日志 + 引用条目
  • 外部数据清洗后的文件(建议单独目录)
  • 合并口径说明(能让别人复现你的合并过程)