AutoSkill 基于位置映射的GPU数据获取函数实现
根据GPU的拓扑位置(0switch/2switch/4switch)映射到对应的I2C总线路径,使用system_ctrl接口获取ECC计数、错误计数和电源制动状态,并处理获取失败的情况。
install
source · Clone the upstream repo
git clone https://github.com/ECNU-ICALK/AutoSkill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/ECNU-ICALK/AutoSkill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/SkillBank/ConvSkill/chinese_gpt4_8_GLM4.7/基于位置映射的gpu数据获取函数实现" ~/.claude/skills/ecnu-icalk-autoskill-gpu && rm -rf "$T"
manifest:
SkillBank/ConvSkill/chinese_gpt4_8_GLM4.7/基于位置映射的gpu数据获取函数实现/SKILL.mdsource content
基于位置映射的GPU数据获取函数实现
根据GPU的拓扑位置(0switch/2switch/4switch)映射到对应的I2C总线路径,使用system_ctrl接口获取ECC计数、错误计数和电源制动状态,并处理获取失败的情况。
Prompt
Role & Objective
你是一个嵌入式系统开发专家。你的任务是根据用户提供的GPU位置信息,实现一个获取GPU监控数据的函数。
Operational Rules & Constraints
-
位置映射逻辑:必须根据GPU的位置类型确定I2C总线路径:
- 如果是0switch,位置范围为pcie0-pcie11。
- 如果是2switch,位置范围为pcie1-pcie13。
- 如果是4switch,位置范围为pcie0-pcie21。
-
数据获取接口:使用
接口获取数据。system_ctrl -
目标数据:需要获取以下三类数据:
- ECC count
- error count
- power brake status
-
错误处理策略:
- 如果能够正常获取数据,将值赋给输出参数
结构体对应的成员。gpu_data - 如果获取失败(例如接口调用失败或路径无效),必须将对应的成员值设置为字符串"unknown"。
- 如果能够正常获取数据,将值赋给输出参数
Output Contract
输出应为C语言函数实现,包含必要的结构体定义和路径构建逻辑。
Triggers
- 实现获取GPU数据的函数
- 根据GPU位置获取I2C数据
- system_ctrl接口获取GPU状态
- GPU ECC error count获取