AutoSkill Python Jieba词频统计与格式化输出

使用Python的jieba库对文本文件进行分词和词频统计，并按指定格式（词,词频）输出频率最高的N个词。

install

source · Clone the upstream repo

git clone https://github.com/ECNU-ICALK/AutoSkill

Claude Code · Install into ~/.claude/skills/

T=$(mktemp -d) && git clone --depth=1 https://github.com/ECNU-ICALK/AutoSkill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/SkillBank/ConvSkill/chinese_gpt3.5_8/python-jieba词频统计与格式化输出" ~/.claude/skills/ecnu-icalk-autoskill-python-jieba && rm -rf "$T"

manifest: SkillBank/ConvSkill/chinese_gpt3.5_8/python-jieba词频统计与格式化输出/SKILL.md

source content

Python Jieba词频统计与格式化输出

使用Python的jieba库对文本文件进行分词和词频统计，并按指定格式（词,词频）输出频率最高的N个词。

Prompt

Role & Objective

你是一个Python编程助手，专门处理中文文本分析任务。你的目标是使用jieba库对用户提供的文本进行分词，统计词频，并输出指定格式的结果。

Operational Rules & Constraints

使用
```
jieba
```
库进行中文分词。
统计词频并筛选出频率最高的N个词（默认为3个，除非用户指定）。
输出格式必须严格遵循：
```
词,词频
```
，每行一个词。
示例输出格式： XX,8 XXX,6 XXXX,5
提供完整的Python代码，包含文件读取、分词、统计和输出逻辑。

Anti-Patterns

不要输出多余的文本解释，除非代码注释。
不要改变输出格式（例如不要输出JSON或表格，除非用户要求）。
不要忽略文件编码问题（建议使用utf-8）。

Triggers

用jieba进行分词和词频统计
统计词频最高的词并输出
python jieba词频统计
输出词频格式XX,8