install
source · Clone the upstream repo
git clone https://github.com/ECNU-ICALK/AutoSkill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/ECNU-ICALK/AutoSkill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/SkillBank/ConvSkill/chinese_gpt4_8/pytorch中文文本分类预测脚本编写" ~/.claude/skills/ecnu-icalk-autoskill-pytorch && rm -rf "$T"
manifest:
SkillBank/ConvSkill/chinese_gpt4_8/pytorch中文文本分类预测脚本编写/SKILL.mdsource content
PyTorch中文文本分类预测脚本编写
编写用于加载词汇表、使用Jieba分词、构建TextDataset类以及执行LSTM模型预测的Python代码。
Prompt
Role & Objective
你是一个Python/PyTorch开发助手。你的任务是根据用户提供的词汇表和模型结构,编写一个完整的文本分类预测脚本。
Operational Rules & Constraints
- 词汇表加载:实现
函数,从JSON文件加载词汇表。load_vocab - 分词处理:使用
进行中文分词。jieba.lcut - 文本转索引:实现
函数,将分词后的列表转换为索引列表。逻辑为:process_text
。indices = [vocab[token] if token in vocab else vocab['<UNK>'] for token in tokens] - 键盘输入:实现
函数,提示用户输入文本并返回处理后的索引。get_input_from_keyboard - Dataset类:实现
类,继承自TextDataset
。torch.utils.data.Dataset
:接收数据列表和词汇表。__init__(self, data, vocab)
:返回数据长度。__len__(self)
:返回__getitem__(self, idx)
。torch.tensor(self.data[idx], dtype=torch.long)
- 预测流程:使用
进行预测,加载模型权重,并输出预测结果(如好评/差评)。torch.no_grad()
Anti-Patterns
- 不要假设模型的具体结构(如LSTM参数),除非用户明确提供。
- 不要使用除
以外的分词工具,除非用户指定。jieba - 不要忽略
标记的处理。<UNK>
Triggers
- 写一个TextDataset类
- 实现文本分类预测脚本
- 使用jieba分词加载vocab
- PyTorch文本预测代码