AivoClaw aminer-data-search
install
source · Clone the upstream repo
git clone https://github.com/yuanyuekejiJN/AivoClaw
Claude Code · Install into ~/.claude/skills/
T=$(mktemp -d) && git clone --depth=1 https://github.com/yuanyuekejiJN/AivoClaw "$T" && mkdir -p ~/.claude/skills && cp -r "$T/extraSkills/aminer-open-academic-1.0.5" ~/.claude/skills/yuanyuekejijn-aivoclaw-aminer-data-search && rm -rf "$T"
manifest:
extraSkills/aminer-open-academic-1.0.5/SKILL.mdsource content
AMiner 开放平台学术数据查询
AMiner 是全球领先的学术数据平台,提供学者、论文、机构、期刊、专利等全维度学术数据。 本 skill 涵盖全部 28 个开放 API,并将它们组合成 6 大实用工作流。
- API 文档:https://open.aminer.cn/open/doc
- 控制台(生成 Token):https://open.aminer.cn/open/board?tab=control
第一步:获取 Token
所有 API 调用需要在请求头中携带
Authorization: <your_token>。
获取方式:
- 前往 AMiner 控制台 登录并生成 API Token
- 若不了解如何操作,请参阅 开放平台文档
Token 请前往 控制台 登录后生成,有效期内可重复使用。
快速使用(Python 脚本)
所有工作流均可通过
scripts/aminer_client.py 驱动:
# 学者全景分析 python scripts/aminer_client.py --token <TOKEN> --action scholar_profile --name "Andrew Ng" # 论文深度挖掘(含引用链) python scripts/aminer_client.py --token <TOKEN> --action paper_deep_dive --title "Attention is all you need" # 机构研究力分析 python scripts/aminer_client.py --token <TOKEN> --action org_analysis --org "清华大学" # 期刊论文监控(指定年份) python scripts/aminer_client.py --token <TOKEN> --action venue_papers --venue "Nature" --year 2024 # 学术智能问答(自然语言提问) python scripts/aminer_client.py --token <TOKEN> --action paper_qa --query "transformer架构最新进展" # 专利搜索与详情 python scripts/aminer_client.py --token <TOKEN> --action patent_search --query "量子计算"
也可以直接调用单个 API:
python scripts/aminer_client.py --token <TOKEN> --action raw \ --api paper_search --params '{"title": "BERT", "page": 0, "size": 5}'
稳定性与失败处理策略(必读)
客户端
scripts/aminer_client.py 内置了请求重试与降级策略,用于减少网络抖动和短暂服务异常对结果的影响。
- 超时与重试
- 默认请求超时:
30s - 最大重试次数:
3 - 退避策略:指数退避(
)+ 随机抖动1s -> 2s -> 4s
- 默认请求超时:
- 可重试状态码
408 / 429 / 500 / 502 / 503 / 504
- 不可重试场景
- 常见
(如参数错误、鉴权问题)默认不重试,直接返回错误结构4xx
- 常见
- 工作流降级
:paper_deep_dive
无结果时自动降级到paper_searchpaper_search_pro
:paper_qa
模式无结果时,自动降级到querypaper_search_pro
- 可追踪调用链
- 组合工作流输出中包含
,用于标记结果由哪些 API 组合得到source_api_chain
- 组合工作流输出中包含
论文搜索接口选型指南
当用户说“查论文”时,先判断目标是“找 ID”、“做筛选”、“做问答”还是“做分析报表”,再选 API:
| API | 侧重点 | 适用场景 | 成本 |
|---|---|---|---|
| 标题检索、快速拿 | 已知论文标题,先定位目标论文 | 免费 |
| 多条件检索与排序(作者/机构/期刊/关键词) | 主题检索、按引用量或年份排序 | ¥0.01/次 |
| 自然语言问答/主题词检索 | 用户用自然语言描述需求,先走语义检索 | ¥0.05/次 |
| 返回更完整论文信息(适合分析) | 需要更丰富字段做分析/报告 | ¥0.30/次 |
| 多关键词批量检索 | 批量专题拉取(如 AlphaFold + protein folding) | ¥0.10/次 |
| 年份+期刊维度拉详情 | 期刊年度监控、选刊分析 | ¥0.20/次 |
推荐路由(默认):
- 已知标题:
paper_search -> paper_detail -> paper_relation - 条件筛选:
paper_search_pro -> paper_detail - 自然语言问答:
(若无结果降级paper_qa_search
)paper_search_pro - 期刊年度分析:
venue_search -> venue_paper_relation -> paper_detail_by_condition
6 大组合工作流
工作流 1:学者全景分析(Scholar Profile)
适用场景:了解某位学者的完整学术画像,包括简介、研究方向、发表论文、专利、科研项目。
调用链:
学者搜索(name → person_id) ↓ 并行调用: ├── 学者详情(bio/教育背景/荣誉) ├── 学者画像(研究方向/兴趣/工作经历) ├── 学者论文(论文列表) ├── 学者专利(专利列表) └── 学者项目(科研项目/资助信息)
命令:
python scripts/aminer_client.py --token <TOKEN> --action scholar_profile --name "Yann LeCun"
输出示例字段:
- 基本信息:姓名、机构、职称、性别
- 个人简介(中英文)
- 研究兴趣与领域
- 教育背景(结构化)
- 工作经历(结构化)
- 论文列表(ID + 标题)
- 专利列表(ID + 标题)
- 科研项目(标题/资助金额/时间)
工作流 2:论文深度挖掘(Paper Deep Dive)
适用场景:根据论文标题或关键词,获取论文完整信息及引用关系。
调用链:
论文搜索 / 论文搜索pro(title/keyword → paper_id) ↓ 论文详情(摘要/作者/DOI/期刊/年份/关键词) ↓ 论文引用(该论文引用了哪些论文 → cited_ids) ↓ (可选)对被引论文批量获取论文信息
命令:
# 按标题搜索 python scripts/aminer_client.py --token <TOKEN> --action paper_deep_dive --title "BERT" # 按关键词搜索(使用 pro 接口) python scripts/aminer_client.py --token <TOKEN> --action paper_deep_dive \ --keyword "large language model" --author "Hinton" --order n_citation
工作流 3:机构研究力分析(Org Analysis)
适用场景:分析某机构的学者规模、论文产出、专利数量,适合竞品研究或合作评估。
调用链:
机构消歧pro(原始字符串 → org_id,处理别名/全称差异) ↓ 并行调用: ├── 机构详情(简介/类型/成立时间) ├── 机构学者(学者列表) ├── 机构论文(论文列表) └── 机构专利(专利ID列表,支持分页,最多10000条)
若有多个同名机构,机构搜索会返回候选列表,可结合机构消歧 pro 精确匹配。
命令:
python scripts/aminer_client.py --token <TOKEN> --action org_analysis --org "MIT" # 指定原始字符串(含缩写/别名) python scripts/aminer_client.py --token <TOKEN> --action org_analysis --org "Massachusetts Institute of Technology, CSAIL"
工作流 4:期刊论文监控(Venue Papers)
适用场景:追踪某期刊特定年份的论文,用于投稿调研或研究热点分析。
调用链:
期刊搜索(name → venue_id) ↓ 期刊详情(ISSN/类型/简称) ↓ 期刊论文(venue_id + year → paper_id 列表) ↓ (可选)论文详情批量查询
命令:
python scripts/aminer_client.py --token <TOKEN> --action venue_papers --venue "NeurIPS" --year 2023
工作流 5:学术智能问答(Paper QA Search)
适用场景:用自然语言或结构化关键词智能搜索论文,支持 SCI 过滤、引用量排序、作者/机构限定。
核心 API:
论文问答搜索(¥0.05/次),支持:
:自然语言提问,系统自动拆解为关键词query
:精细控制关键词权重(嵌套数组 OR/AND 逻辑)topic_high/middle/low
:只看 SCI 论文sci_flag
:按引用量排序force_citation_sort
:限定作者或机构author_terms / org_terms
命令:
# 自然语言问答 python scripts/aminer_client.py --token <TOKEN> --action paper_qa \ --query "用于蛋白质结构预测的深度学习方法" # 精细关键词搜索(必须同时含 A 和 B,加分含 C) python scripts/aminer_client.py --token <TOKEN> --action paper_qa \ --topic_high '[["transformer","self-attention"],["protein folding"]]' \ --topic_middle '[["AlphaFold"]]' \ --sci_flag --sort_citation
工作流 6:专利链分析(Patent Analysis)
适用场景:搜索特定技术领域的专利,或获取某学者/机构的专利组合。
调用链(独立搜索):
专利搜索(query → patent_id) ↓ 专利详情(摘要/申请日/申请号/受让人/发明人)
调用链(经由学者/机构):
学者搜索 → 学者专利(patent_id 列表) 机构消歧 → 机构专利(patent_id 列表) ↓ 专利信息 / 专利详情
命令:
python scripts/aminer_client.py --token <TOKEN> --action patent_search --query "量子计算芯片" python scripts/aminer_client.py --token <TOKEN> --action scholar_patents --name "张首晟"
单独 API 速查表
完整参数说明请阅读
references/api-catalog.md
| # | 标题 | 方法 | 价格 | 接口路径(基础域名:datacenter.aminer.cn/gateway/open_platform) |
|---|---|---|---|---|
| 1 | 论文问答搜索 | POST | ¥0.05 | |
| 2 | 学者搜索 | POST | 免费 | |
| 3 | 论文搜索 | GET | 免费 | |
| 4 | 论文搜索pro | GET | ¥0.01 | |
| 5 | 专利搜索 | POST | 免费 | |
| 6 | 机构搜索 | POST | 免费 | |
| 7 | 期刊搜索 | POST | 免费 | |
| 8 | 学者详情 | GET | ¥1.00 | |
| 9 | 学者项目 | GET | ¥3.00 | |
| 10 | 学者论文 | GET | ¥1.50 | |
| 11 | 学者专利 | GET | ¥1.50 | |
| 12 | 学者画像 | GET | ¥0.50 | |
| 13 | 论文信息 | POST | 免费 | |
| 14 | 论文详情 | GET | ¥0.01 | |
| 15 | 论文引用 | GET | ¥0.10 | |
| 16 | 专利信息 | GET | 免费 | |
| 17 | 专利详情 | GET | ¥0.01 | |
| 18 | 机构详情 | POST | ¥0.01 | |
| 19 | 机构专利 | GET | ¥0.10 | |
| 20 | 机构学者 | GET | ¥0.50 | |
| 21 | 机构论文 | GET | ¥0.10 | |
| 22 | 期刊详情 | POST | ¥0.20 | |
| 23 | 期刊论文 | POST | ¥0.10 | |
| 24 | 机构消歧 | POST | ¥0.01 | |
| 25 | 机构消歧pro | POST | ¥0.05 | |
| 26 | 论文搜索接口 | GET | ¥0.30 | |
| 27 | 论文批量查询 | GET | ¥0.10 | |
| 28 | 按年份与期刊获取论文详情 | GET | ¥0.20 | |
参考资料
- 完整 API 参数文档:读取
references/api-catalog.md - Python 客户端源码:
scripts/aminer_client.py - 测试用例:
evals/evals.json - 官方文档:https://open.aminer.cn/open/doc
- 控制台:https://open.aminer.cn/open/board?tab=control