daily-paper
install
source · Clone the upstream repo
git clone https://github.com/ychenjk-sudo/daily-paper-skill
Claude Code · Install into ~/.claude/skills/
git clone --depth=1 https://github.com/ychenjk-sudo/daily-paper-skill ~/.claude/skills/ychenjk-sudo-daily-paper-skill-daily-paper
manifest:
SKILL.mdsource content
Daily Paper - 具身智能论文速递
自动化学术调研工具,专注于具身智能(Embodied AI)领域。
研究方向(按优先级排序)
- VLA / 多模态机器人 - Vision-Language-Action、多模态指令控制
- 世界模型 (World Model) - 视频预测、物理模拟、生成式世界模型
- 强化学习 (RL) - Robot RL、Imitation Learning、Offline RL
- 仿真 (Simulation) - Sim2Real、物理仿真、可微仿真
- 自动驾驶 - 端到端驾驶、BEV、占用网络
不收录:开源工具/框架、效率优化、纯数据集、纯 LLM、纯视觉
数据源
- arXiv(主要): cs.RO, cs.LG, cs.CV, cs.AI
- Semantic Scholar: 追踪重点作者(Jim Fan, Pieter Abbeel, Sergey Levine 等)
- GitHub Trending: 新开源项目
- Hugging Face: robotics、RL、world-model 标签
执行流程
步骤 1:获取数据
# arXiv python scripts/fetch.py --output /tmp/arxiv_papers.json # Semantic Scholar(重点作者) python scripts/fetch_semantic_scholar.py --days 7 --output /tmp/s2_papers.json # GitHub Trending python scripts/fetch_github.py --output /tmp/github_repos.json # Hugging Face python scripts/fetch_huggingface.py --output /tmp/huggingface.json
步骤 2:筛选论文
日报:3-6 篇 | 周报:4-6 篇
评分维度:
- Novelty(新颖性)
- Impact(潜在影响力)
- Engineering Value(工程价值)
重点机构优先:NVIDIA, DeepMind, Berkeley, Stanford, MIT, Tesla AI, Physical Intelligence
步骤 3:生成报告
报告结构:
# 具身智能论文速递 (日期) ## 📌 摘要 ## 🔮 Crossing Trend(基于当期论文的客观事实) ## 📚 论文分类详情 ### 🤖 VLA / 多模态 ### 🌍 世界模型 ### 🎮 强化学习 ### 🚗 自动驾驶
每篇论文的固定输出结构:
⚠️ 重要:写每篇论文前,必须先用 web_fetch 读取论文的 arXiv HTML 版本(如 https://arxiv.org/html/2602.18224v1),理解技术细节后再写。只看 abstract 写出来的内容会很浅。
### [论文标题](arXiv链接) - **一句话摘要**:50字以内概括核心贡献 - **解决的工程/算法瓶颈**:(50-100字)具体说明针对什么问题,为什么之前的方法解决不了,要有技术细节 - **相对 SOTA 的核心改进点**(≤3条):每条要具体,最好有数据支撑(如「LIBERO 上 98.5% 成功率」) 1. 改进点1(带具体数据/对比) 2. 改进点2 3. 改进点3 - **工程落地潜力与前置条件**:(50-100字)分「潜力」和「前置条件」两部分写,要具体到硬件要求、数据需求等 - **风险与局限**:(50-100字)不是泛泛而谈,要指出具体在什么场景/任务下会失效 - **对自动驾驶/机器人系统的启示**:(50-100字)不是复述论文,而是从工程师视角提炼可迁移的洞见,可以类比其他领域(如 LLM、自动驾驶)的经验 - **潜在应用场景**:具体应用方向 - **论文链接**:arXiv链接(有代码附上GitHub)
Crossing Trend 格式:
- 本周证据:哪些论文体现了这个趋势
- 技术迁移:哪项技术从哪个领域迁移过来
- 趋势判断:基于事实的客观判断
步骤 4:发布
根据当前渠道自动选择输出方式:
飞书渠道
- 创建或使用飞书文档:
- 如果用户未指定文档 ID,使用飞书 API 创建新文档
- 如果用户指定了文档 ID/链接,写入该文档
- 新内容插入文档顶部
# 创建新文档并写入 python scripts/feishu.py --input /workspace/daily-papers/YYYY-MM-DD-cn.md --create --title "论文速递 YYYY-MM-DD" # 写入已有文档 python scripts/feishu.py --input /workspace/daily-papers/YYYY-MM-DD-cn.md --doc-id <用户提供的DOC_ID>
- 发送飞书卡片(可选):
python /workspace/scripts/feishu_card.py --to <CHAT_ID> --template daily-paper --data <JSON_FILE>
非飞书渠道(Telegram/Discord/终端等)
直接输出 Markdown 文档内容,或保存到本地文件:
# 保存到本地 cat /workspace/daily-papers/YYYY-MM-DD-cn.md # 或直接在消息中输出 Markdown 格式的报告
输出示例(非飞书):
# 具身智能论文速递 (2026-02-24) ## 📌 摘要 今日精选 4 篇论文,覆盖 VLA、世界模型、强化学习领域... ## 🔮 Crossing Trend ... ## 📚 论文详情 ### 🤖 VLA / 多模态 #### [论文标题](https://arxiv.org/abs/xxxx) ...
配置
重点关注机构
NVIDIA, DeepMind, UC Berkeley/BAIR, Stanford, MIT, Tesla AI, Physical Intelligence, 1X Technologies, Figure AI, OpenAI, Anthropic, Meta AI/FAIR, Covariant
重点作者(Semantic Scholar 追踪)
Jim Fan (Linxi Fan), Pieter Abbeel, Sergey Levine, Chelsea Finn, Danijar Hafner, Yann LeCun, Kaiming He, Ilya Sutskever
重点论文系列
Dreamer 系列, DreamZero/DreamDojo, RT 系列, OpenVLA/Octo, ALOHA, JEPA 系列
用户配置(可选)
用户可以在对话中指定:
- 飞书文档 ID:
或直接粘贴文档链接--doc-id WPmJdLKAvohbGaxBRmLc08MVn5f - 输出格式:
强制输出 Markdown--format md - 推送对象:
指定飞书消息接收人--to <open_id>
如果未指定,根据当前会话渠道自动选择输出方式。
Prompt 文件
- 日报卡片:
/workspace/prompts/daily-paper-card.md - 周报卡片:
/workspace/prompts/weekly-paper-card.md
定时任务示例
{ "name": "Daily Paper", "schedule": {"kind": "cron", "expr": "0 9 * * *", "tz": "Asia/Shanghai"}, "sessionTarget": "isolated", "payload": { "kind": "agentTurn", "model": "gemini", "message": "执行今日论文速递,输出到飞书文档", "deliver": true, "channel": "feishu", "to": "<your_open_id>" } }