输出
定义 output_schema 来帮助用户更好地理解采集的数据。数据界面将根据 output_schema.json 中的定义进行人性化展示数据。
规范
output_schema.json 文件放置于项目的根目录,与 input_schema.json 同级。
格式定义
假如采集的一条数据为:
{
  "screen_name": "三联生活周刊",
  "comments_count": 10,
  "avatar": "https://img1.baidu.com/it/u=4184108043,3897330245&fm=253&fmt=auto&app=138&f=JPEG?w=500&h=460",
  "target_url": "https://vote.weibo.com/h5/index/index?vote_id=2024_203989_-_8a5c9a",
  "following": true,
  "text_raw": "据四川观察报道,近日,浙江杭州一小学取消寒假作业,寒假生活以综合学习……",
  "pic_ids": [
    "16302319",
    "7481156202"
  ],
  "user_info": {
    "user_name": "sanlian"
  }
}
则 output_schema.json 可以这样定义:
{
  "component": "table",
  // 必须, 选用的组件, table 表示用表格展示
  "columns": {
    "screen_name": {
      "title": "昵称",
      // 必须,表格的表头
      "type": "string"
      // 必须,展现样式,目前支持 string、number、image、link、bool、array、object 类型
    },
    "comments_count": {
      "title": "评论数",
      "type": "number"
    },
    "avatar": {
      "title": "头像",
      "type": "image"
      // 图片
    },
    "target_url": {
      "title": "链接",
      "type": "link"
      // 链接,用户可点击
    },
    "following": {
      "title": "是否关注",
      "type": "bool"
    },
    "text_raw": {
      "title": "贴文",
      "type": "string"
    },
    "pic_ids": {
      "title": "图片 id",
      "type": "array"
      // 数组类型
    },
    "user_info": {
      "title": "用户信息",
      "type": "object"
      // 对象类型
    }
  }
}
定义每个字段的 title (表头名称)和 type (展示组件)。界面上的数据表格只展示 output_schema.json 中定义的字段。
展示效果如下: 
支持的组件类型(component 字段)
目前只支持 table
支持的样式类型(type 字段)
| 样式类型 | 数据类型 | 展示样式 | 
|---|---|---|
| string | 文本 | 直接展示 | 
| number | 数字,包括浮点型数字 | 直接展示 | 
| link | 链接 | 可点击在新窗口打开此链接 | 
| image | 图片 | 图片样式展示 | 
| bool | 布尔型 | 展示 ❎ 或者 ✅ | 
| array | 数组 | 展示 item 个数,可点击展开详情,json详情 | 
| object | 对象 | 可点击展开详情,json 展示 | 
Last modified: 16 十月 2024