编辑“︁SAF2 星图词条处理Agent设计方案”︁（章节）

= 星图词条自动处理Agent设计方案 =

== 一、系统概述 ==
基于OpenClaw Gateway + OpenCLI + 两个Skill，设计一个自动化Agent来处理星图词条的采集、生成、人性化和发布流程。

== 二、核心能力 ==

=== 2.1 数据采集能力（基于OpenCLI） ===

* '''社交平台搜索'''：Bilibili、小红书、知乎、微博、豆瓣等
* '''内容抓取'''：帖子、评论、用户画像、热榜数据
* '''趋势监测'''：热搜、话题、标签追踪

=== 2.2 内容生成能力 ===

* '''词条撰写'''：按照星图L1-L5模板生成结构化内容
* '''分类判定'''：根据SA0指南自动分类到正确层级
* '''交叉标签'''：自动提取平台、地域、参与方式等标签

=== 2.3 内容优化能力（基于humanizer-zh） ===

* '''去AI痕迹'''：移除生成文本的机械感
* '''风格统一'''：符合星图中性、描述性、可验证的文风
* '''质量评分'''：自动评估内容质量（50分制）

== 三、Agent架构设计 ==

=== 3.1 Standing Orders（持久指令） ===
在 <code>AGENTS.md</code> 中定义星图词条处理的持久授权：
 <code># 星图词条处理Agent - Standing Orders
 
 ## Program: 星图词条自动采集与生成
 
 **Authority:** 
 - 搜索社交平台圈层内容
 - 采集用户画像、帖子、评论数据
 - 生成符合星图标准的词条草稿
 - 自动分类和打标签
 - 人性化处理文本
 
 **Trigger:** 
 - 每日定时扫描（cron: 0 9 * * *）
 - 手动触发：收到"处理词条：[主题]"消息
 - Webhook触发：外部系统提交新词条请求
 
 **Approval gate:**
 - 词条草稿生成后需人工审核
 - L1/L2层级词条必须人工确认分类
 - 涉及争议内容的词条需标记并等待审批
 
 **Escalation:**
 - 无法确定分类层级时
 - 发现多个平台数据严重冲突时
 - 采集到疑似敏感/违规内容时
 - 连续3次生成质量评分<35分时
 
 ### Execution Steps
 
 1. **数据采集阶段**
    - 使用opencli搜索目标平台（bilibili/xiaohongshu/zhihu等）
    - 提取关键信息：群体特征、参与方式、平台分布、术语黑话
    - 收集证据：帖子链接、用户数、活跃度数据
    
 2. **分类判定阶段**
    - 读取 SA0-星图写作与分类总指南.md
    - 根据参与动机、核心行为、组织方式判定主分类
    - 确定L1-L5层级位置
    - 生成交叉标签（平台、地域、参与方式等）
 
 3. **词条生成阶段**
    - 按照对应层级模板生成MediaWiki格式词条
    - 包含：定义、边界、参与者画像、典型表现、争议与风险
    - 标注证据等级（A/B/C）
    - 建立双向链接
 
 4. **人性化处理阶段**
    - 调用humanizer-zh skill
    - 去除AI生成痕迹
    - 确保符合星图文风：中性、描述性、可验证
    - 质量评分（目标≥40分）
 
 5. **验证与报告阶段**
    - 检查词条完整性（6件事都回答了吗？）
    - 验证分类唯一性和标签准确性
    - 生成处理报告：采集源、分类路径、质量评分
    - 提交审核或保存草稿
 
 ### What NOT to Do
 
 - 不要创建一次性热点词条（无社群沉淀）
 - 不要收录纯商业促销活动
 - 不要使用价值审判语言（"低俗/高雅"）
 - 不要在无法验证时编造数据
 - 不要跳过人性化处理步骤
 - 不要自动发布未经审核的词条</code>

=== 3.2 Cron Jobs（定时任务） ===
'''每日热点扫描任务'''
 <code>openclaw cron add \
   --name staratlas-daily-scan \
   --cron "0 9 * * *" \
   --tz Asia/Shanghai \
   --timeout-seconds 600 \
   --announce \
   --channel telegram \
   --message "执行星图每日热点扫描。检查B站、小红书、知乎热榜，识别新兴圈层。按standing orders处理发现的词条候选。"</code>
'''每周深度分析任务'''
 <code>openclaw cron add \
   --name staratlas-weekly-analysis \
   --cron "0 14 * * 5" \
   --tz Asia/Shanghai \
   --timeout-seconds 1800 \
   --announce \
   --channel telegram \
   --message "执行星图每周深度分析。回顾本周新增词条，检查分类准确性，更新争议内容，生成质量报告。"</code>

=== 3.3 Task Flow（工作流编排） ===
'''词条处理完整流程'''（Managed模式）
 <code>Flow: entry-processing-[topic]
   Step 1: data-collection    → 使用opencli采集多平台数据
   Step 2: classification     → 判定分类层级和标签
   Step 3: draft-generation   → 生成词条草稿
   Step 4: humanization       → 调用humanizer-zh优化
   Step 5: quality-check      → 验证完整性和质量
   Step 6: submit-for-review  → 提交审核队列</code>

=== 3.4 Hooks（事件驱动） ===
'''词条提交后钩子''' (<code>~/.openclaw/hooks/entry-submitted.sh</code>)
 <code>#!/bin/bash
 # 词条提交后自动通知审核人员
 ENTRY_FILE="$1"
 ENTRY_TITLE=$(grep "^= " "$ENTRY_FILE" | head -1 | sed 's/^= //' | sed 's/ =$//')
 
 curl -X POST "<nowiki>https://your-webhook-url</nowiki>" \
   -H "Content-Type: application/json" \
   -d "{\"title\": \"$ENTRY_TITLE\", \"file\": \"$ENTRY_FILE\", \"status\": \"pending_review\"}"</code>

== 四、实施步骤 ==

=== 4.1 环境准备 ===

# '''安装OpenClaw'''

 <code>npm install -g openclaw@latest
 openclaw onboard --install-daemon</code>

# '''安装OpenCLI'''

 <code>npm install -g @jackwener/opencli
 # 安装Chrome扩展：加载 extension/ 目录到 chrome://extensions</code>

# '''配置Skills'''

 <code># 将两个skill复制到OpenClaw skills目录
 cp -r ~/Desktop/skills/opencli-usage ~/.openclaw/skills/
 cp -r ~/Desktop/skills/Humanizer-zh-main ~/.openclaw/skills/</code>

# '''配置浏览器登录'''

* 在Chrome中登录：Bilibili、小红书、知乎、微博、豆瓣等平台
* 确保opencli Browser Bridge扩展已启用

=== 4.2 创建工作空间 ===
 <code>mkdir -p ~/staratlas-workspace
 cd ~/staratlas-workspace
 
 # 创建目录结构
 mkdir -p {drafts,published,审核队列,数据采集,质量报告}
 
 # 复制星图指南
 cp ~/Documents/KB/main/星图/SA0-星图写作与分类总指南.md ./</code>

=== 4.3 配置Standing Orders ===
创建 <code>AGENTS.md</code>：
 <code># 星图词条处理Agent
 
 [将3.1节的Standing Orders内容粘贴到这里]
 
 ## 工作目录结构
 - drafts/: 词条草稿
 - published/: 已发布词条
 - 审核队列/: 待审核词条
 - 数据采集/: 原始采集数据
 - 质量报告/: 质量评估报告
 
 ## 命名规范
 - 草稿：`SA-L[层级]-[编码]-[标题]-draft-[日期].md`
 - 正式：`SA-L[层级]-[编码]-[标题].md`</code>

=== 4.4 设置Cron任务 ===
 <code># 添加每日扫描
 openclaw cron add --name staratlas-daily-scan \
   --cron "0 9 * * *" --tz Asia/Shanghai \
   --timeout-seconds 600 --announce \
   --message "执行星图每日热点扫描"
 
 # 添加每周分析
 openclaw cron add --name staratlas-weekly-analysis \
   --cron "0 14 * * 5" --tz Asia/Shanghai \
   --timeout-seconds 1800 --announce \
   --message "执行星图每周深度分析"</code>

== 五、使用示例 ==

=== 5.1 手动触发词条处理 ===
通过Telegram/WhatsApp发送消息：
 <code>处理词条：原神二创圈</code>
Agent会自动：

# 搜索B站、小红书、知乎相关内容
# 采集数据并分类（可能是L1-C > L2-C2 > L3-xxx）
# 生成词条草稿
# 人性化处理
# 提交审核队列并通知你

=== 5.2 查看处理进度 ===
 <code># 查看活跃的工作流
 openclaw tasks flow list
 
 # 查看特定词条处理详情
 openclaw tasks flow show entry-processing-原神二创圈
 
 # 查看所有后台任务
 openclaw tasks list</code>

=== 5.3 审核词条 ===

# 收到审核通知后，打开 <code>审核队列/</code> 目录
# 检查词条内容：
#* 分类是否准确？
#* 6个必答问题都回答了吗？
#* 证据等级标注了吗？
#* 文风是否中性、可验证？
# 批准或要求修改

== 六、质量控制 ==

=== 6.1 自动质量检查 ===
每个词条生成后自动检查：

* ✓ 主分类唯一且合理
* ✓ 至少2个交叉标签
* ✓ 写清"是什么/不是什么"
* ✓ 有可验证来源
* ✓ 没有价值评判措辞
* ✓ 与相邻词条建立双向链接
* ✓ Humanizer质量评分≥40分

=== 6.2 人工审核要点 ===
'''必须人工审核的情况：'''

* L1/L2层级词条（影响整体分类体系）
* 涉及争议内容的词条
* 质量评分35-40分的边缘词条
* Agent标记为"需要escalation"的词条

'''审核清单：'''

# 分类准确性：是否放对了L1-L5位置？
# 边界清晰度：与相邻类别区分明确吗？
# 证据充分性：来源可验证吗？
# 文风合规性：是否中性、描述性？
# 完整性：6件事都回答了吗？

== 七、扩展方向 ==

=== 7.1 增强数据源 ===

* 添加更多平台：抖音、快手、贴吧
* 接入学术数据库：CNKI、万方
* 整合媒体报道：36氪、虎嗅

=== 7.2 智能分类优化 ===

* 训练分类模型：基于历史词条数据
* 相似度检测：避免重复词条
* 自动关联：发现词条间隐含关系

=== 7.3 协作功能 ===

* Webhook集成：连接外部审核系统
* 多人协作：分配审核任务
* 版本控制：词条迭代历史追踪

== 八、注意事项 ==

=== 8.1 数据合规 ===

* 遵守各平台robots.txt和使用条款
* 不采集个人隐私信息
* 敏感内容需特殊标记

=== 8.2 质量优先 ===

* 宁缺毋滥：质量不达标的词条不发布
* 持续迭代：定期回顾和更新已发布词条
* 社群反馈：建立词条纠错机制

=== 8.3 系统维护 ===

* 定期检查opencli登录状态
* 监控cron任务执行情况
* 备份词条数据和配置文件

== 九、故障排查 ==

=== 9.1 常见问题 ===
'''问题1：opencli命令失败'''
 <code># 检查浏览器扩展
 opencli doctor
 
 # 重启daemon
 openclaw daemon restart</code>
'''问题2：词条质量评分持续偏低'''

* 检查humanizer-zh skill是否正确加载
* 调整生成提示词，强调星图文风要求
* 增加人工干预频率

'''问题3：分类判定不准确'''

* 更新SA0指南到最新版本
* 增加分类示例到standing orders
* 对边界模糊的案例建立决策树

=== 9.2 日志查看 ===
 <code># 查看Gateway日志
 openclaw logs
 
 # 查看特定任务日志
 openclaw tasks show <task-id>
 
 # 查看cron执行历史
 openclaw cron list</code>

== 十、总结 ==
这个Agent设计方案充分利用了OpenClaw的自动化能力：

* '''Standing Orders''' 定义持久授权和执行规范
* '''Cron Jobs''' 实现定时扫描和分析
* '''Task Flow''' 编排多步骤处理流程
* '''Hooks''' 处理事件驱动的通知
* '''Skills''' 复用opencli和humanizer能力

通过这套系统，你可以：

# 自动发现和采集新兴圈层信息
# 按照星图标准生成高质量词条
# 保持人工审核的质量控制
# 持续迭代和优化词条库

建议从小规模试点开始，逐步扩展到更多平台和词条类型。