Claude-skill-registry hatena-blog-markdown-extractor
Extract content from Hatena Blog article URLs and convert to Markdown format with frontmatter. Preserves images as absolute URLs and removes sidebars, headers, footers, and ads.
install
source · Clone the upstream repo
git clone https://github.com/majiayu000/claude-skill-registry
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/majiayu000/claude-skill-registry "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/data/hatena-md" ~/.claude/skills/majiayu000-claude-skill-registry-hatena-blog-markdown-extractor && rm -rf "$T"
manifest:
skills/data/hatena-md/SKILL.mdsource content
Hatena Blog Markdown Extractor
はてなブログの記事URLからコンテンツをMarkdown形式で抽出するスキルです。
機能
- はてなブログの記事URLから本文を抽出
- HTML → Markdown変換
- 画像URLをフルパス(絶対パス)で保持
- サイドバー、ヘッダー、フッター、広告などの不要な要素を自動除去
- フロントマター付きMarkdownファイルを生成
使用方法
# 単一のURLから抽出 /hatena-md <記事URL> # カスタム出力ディレクトリを指定 /hatena-md <記事URL> <出力ディレクトリ>
例
# デフォルトの出力先 (./hatena-posts/) に保存 /hatena-md https://www.simple-web-system.work/entry/2024/10/17/223212 # カスタム出力先に保存 /hatena-md https://www.simple-web-system.work/entry/2024/10/17/223212 ./my-posts
出力形式
抽出されたMarkdownファイルには以下のフロントマターが付きます:
--- title: "記事タイトル" url: https://www.simple-web-system.work/entry/2024/10/17/223212 extracted: 2025-10-27T09:46:00.000Z --- 記事本文...
出力先
- デフォルト:
./hatena-posts/ - ファイル名: 記事タイトル.md (特殊文字は除去・置換されます)
注意事項
- Node.jsプロジェクトとしてセットアップされている必要があります
- 実行前に
とnpm install
を実行してくださいnpm run build