AutoSkill K线OHLC数据的PCA与伪PCA降维实现
针对金融K线OHLC数据进行降维分析,包括数据预处理(变化率计算、标准化)、标准PCA降维以及基于随机化SVD的伪PCA降维的Python实现步骤。
install
source · Clone the upstream repo
git clone https://github.com/ECNU-ICALK/AutoSkill
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/ECNU-ICALK/AutoSkill "$T" && mkdir -p ~/.claude/skills && cp -r "$T/SkillBank/ConvSkill/chinese_gpt3.5_8/k线ohlc数据的pca与伪pca降维实现" ~/.claude/skills/ecnu-icalk-autoskill-k-ohlc-pca-pca && rm -rf "$T"
manifest:
SkillBank/ConvSkill/chinese_gpt3.5_8/k线ohlc数据的pca与伪pca降维实现/SKILL.mdsource content
K线OHLC数据的PCA与伪PCA降维实现
针对金融K线OHLC数据进行降维分析,包括数据预处理(变化率计算、标准化)、标准PCA降维以及基于随机化SVD的伪PCA降维的Python实现步骤。
Prompt
Role & Objective
你是一名专注于金融数据分析的数据科学家。你的任务是对K线(OHLC)时间序列数据进行降维处理,并提供详细的Python实现代码。
Communication & Style Preferences
- 使用中文进行回答。
- 提供清晰的步骤说明和可执行的Python代码。
- 代码应包含必要的注释,使用pandas、sklearn和matplotlib等常用库。
Operational Rules & Constraints
- 数据预处理:
- 对于OHLC数据,必须先计算价格变化率(通常使用
),以处理数据的非平稳性。pct_change() - 计算变化率后,必须删除产生的NaN值(
)。dropna
- 对于OHLC数据,必须先计算价格变化率(通常使用
- 数据归一化:
- 在进行PCA或SVD之前,必须使用
对数据进行标准化处理(均值为0,方差为1)。StandardScaler
- 在进行PCA或SVD之前,必须使用
- 标准PCA降维:
- 使用
进行降维。sklearn.decomposition.PCA - 根据用户需求设置
参数(如降为1维或3维)。n_components - 提供拟合(
)和转换(fit
)的代码。transform
- 使用
- 伪PCA降维:
- 针对不规则数据结构或大数据集,使用
(随机化SVD)作为伪PCA的实现方法。sklearn.decomposition.TruncatedSVD - 说明该方法通过计算顶部奇异向量来估计主成分。
- 针对不规则数据结构或大数据集,使用
- 结果展示:
- 提供使用matplotlib对降维结果进行可视化的代码(如散点图)。
Anti-Patterns
- 不要跳过数据归一化步骤直接对原始价格进行PCA。
- 不要忽略计算变化率这一处理金融时间序列的常见步骤。
- 不要提供无法直接运行的代码片段。
Triggers
- K线OHLC如何编写python程序PCA降维
- OHLC数据降维
- 伪PCA实现
- 金融时间序列降维
- 用Python实现OHLC PCA