Kweaver-dip data-quality
基于 Data View 和 Task Center API 的数据质量管理。管理质量规则、查询逻辑视图、创建检测工单。当用户需要数据质量相关操作时使用。
install
source · Clone the upstream repo
git clone https://github.com/kweaver-ai/kweaver-dip
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/kweaver-ai/kweaver-dip "$T" && mkdir -p ~/.claude/skills && cp -r "$T/skills/data-quality" ~/.claude/skills/kweaver-ai-kweaver-dip-data-quality && rm -rf "$T"
manifest:
skills/data-quality/SKILL.mdsource content
数据质量管理
核心能力
| 能力 | 说明 | API 端点 |
|---|---|---|
| 质量规则 | 质量规则的增删改查 | |
| 逻辑视图 | 查询视图列表和字段信息 | |
| 检测工单 | 创建和跟踪检测工单 | |
| 知识网络 | 基于知识网络配置规则 | |
技能入参
技能接受以下入参,大模型在调用技能时应按以下格式传递:
{ "query": "用户提问内容(必须)", "business_docs": ["业务知识文档列表(可选)"], "business_desc": "业务知识描述文本(可选)", "context": "其它可用上下文文本(可选)" }
入参说明
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
| string | 是 | 用户提问内容,描述用户想要执行的数据质量管理操作 |
| array | 否 | 业务知识文档列表,用户提供配置质量规则时的业务知识文档 |
| string | 否 | 业务知识描述文本,用户提供配置质量规则时的业务知识文本描述 |
| string | 否 | 其它可用上下文文本,用户提供必要的上下文依据 |
入参使用场景总览
| 场景 | query | context | business_desc | business_docs |
|---|---|---|---|---|
| 知识网络质量分析 | ✅ | ✅ | ✅ | ✅ |
| 视图质量查询 | ✅ | ✅ | ✅ | ✅ |
| 规则配置 | ✅ | ✅ | ✅ | ✅ |
| 质量检测 | ✅ | ✅ | - | - |
| 问题诊断 | ✅ | ✅ | - | - |
入参职责区分
重要: 各入参有明确的职责分工,不得混用:
| 入参 | 职责 | 说明 |
|---|---|---|
| 目标识别(第一优先级) | 用于确定要分析的知识网络或对象类 |
| 目标识别(第二优先级) | 当query中没有明确目标时,从context中提取知识网络或对象类信息 |
| 规则配置依据 | 仅作为配置质量规则时的业务语义来源 |
| 规则配置依据 | 仅作为配置质量规则时的业务文档来源 |
目标识别优先级:
1. 首先从 query 中提取知识网络/对象类信息 2. 如果 query 中没有明确目标,才从 context 中提取 3. business_desc 和 business_docs 永远不能用于确定分析目标
使用优先级
- query 始终必须,用于确定用户意图和分析目标
- context 用于提供必要的上下文依据,当query无目标时作为分析目标的补充来源
- business_desc 仅用于配置质量规则时提供业务语义
- business_docs 仅用于配置质量规则时提供业务文档
前置条件
DATA_QUALITY_BASE_URL=https://10.4.134.26 DATA_QUALITY_AUTH_TOKEN=Bearer xxxxxx
验证:
GET {BASE_URL}/api/eacp/v1/user/get
关键约束
详细约束请参考: 核心约束参考
- 配置优先: 使用前必须先验证环境变量
- 有据可依: 规则配置必须有明确的依据
- 配置非空: 创建规则时
不能为空rule_config - 技术名称:
中的 SQL 表达式必须使用字段技术名称rule_config - 无报告不终止: 查询质量报告时如返回"探查报告不存在",统一按"暂无质量报告"理解,继续进入"是否配置规则并发起检测"的确认步骤
- 已授权可直走: 如果用户在当前轮已明确表达"继续处理/解决问题/发起检测",则可直接进入规则配置与质量检测流程
- ID语义不能混用: 知识网络对象类中的
是统一视图ID(用于data_source.id
查逻辑视图),不是工单mdl_iddatasource_id - 工单数据源来源:
、datasource_id
、datasource_name
必须来自逻辑视图datasource_type - 成功响应兼容: 创建规则成功状态以
都视为成功;创建工单成功后优先读取200/201
,并兼容idwork_order_id - 评分展示格式: 评分直接展示数值,不带 "/100" 后缀,四舍五入到两位小数
- 质量报告null值处理: 维度评分为null时显示为"未配置",不参与综合评分计算
- 统一检测策略: 多视图需要检测时,优先为所有视图配置规则,然后统一创建一个质量检测工单
- 业务视角分析: 质量报告分析必须结合business_desc和business_docs,从业务视角解读质量指标
文档结构
data-quality/ ├── SKILL.md # 本文件 - 主入口 ├── CHANGELOG.md # 版本历史 ├── README.md # 文档指南 │ ├── core/ # 核心概念层 (L1) │ └── core.md # 核心概念 │ ├── guides/ # 用户指南层 (L2) │ ├── quickstart.md # 快速开始指南 │ └── detailed-guide.md # 详细工作流 │ ├── reference/ # 参考文档 │ ├── core-constraints.md # 核心约束(共享引用) │ ├── glossary.md # 术语表 │ ├── quality-inspection-workflow.md # 质量检测工作流 │ ├── knowledge-network-workflow.md # 知识网络工作流 │ ├── batch-processing-guide.md # 批量配置处理流程 │ ├── error-handling.md # 错误处理指南 │ ├── quality-report-scoring.md # 评分处理策略 │ ├── api-overview.md # API 概览 │ ├── intent-recognition.md # 意图识别 │ ├── pagination.md # 分页规范 │ ├── api-path-validation.md # API 路径验证 │ ├── api-usage-guide.md # API 使用规范 │ └── api/ # 详细 API 文档 │ ├── api_data_view.md │ ├── api_task_center.md │ ├── api_knowledge_network.md │ ├── api_eacp.md │ └── api_std.md │ └── examples/ # 代码示例 └── basic-usage.md # 基础用法示例
渐进式加载指南
用户请求分析 │ ├─ 简单查询(视图/字段) ──▶ 加载核心 + 快速开始 │ ├─ 规则配置 ──▶ 加载快速开始 + API 指南 │ ├─ 质量检测 ──▶ 加载详细指南 + 质量检测工作流 │ ├─ 知识网络 ──▶ 加载详细指南 + 知识网络工作流 │ ├─ 错误处理 ──▶ 加载错误处理指南 │ └─ 复杂/错误场景 ──▶ 加载全部 + 示例
快速导航
| 文档 | 用途 |
|---|---|
| 核心概念 | 核心信息和快速参考 |
| 快速开始 | 详细示例和常用操作 |
| 详细指南 | 完整工作流和高级功能 |
| 质量检测工作流 | 质量检测完整流程 |
| 知识网络工作流 | 知识网络场景处理 |
| 批量配置处理 | 分页加载与串行处理 |
| 核心约束 | 共享约束参考 |
| 错误处理 | 完整错误处理指南 |
| 评分处理 | 评分转换与展示 |
| API 概览 | API 参考 |
| 术语表 | 术语说明 |
| 示例代码 | 代码样例 |