logo
icon

集蜂云Docs

集蜂云
控制台
市场
设置
费用
采集器
运行与构建
输入与输出
构建
任务
发布
分享
开发
快速开始
创建采集器
输入
输出
采集队列
键值对
SDK
代码示例
数据-存储
数据-数据集
数据-键值对
数据-采集队列
代理
集成
webhook
企业微信
飞书
钉钉
邮箱
与其他采集器
收益
API

输出

定义 output_schema 来帮助用户更好地理解采集的数据。数据界面将根据 output_schema.json 中的定义进行人性化展示数据。

规范

output_schema.json 文件放置于项目的根目录,与 input_schema.json 同级。

格式定义

假如采集的一条数据为:

{
  "screen_name": "三联生活周刊",
  "comments_count": 10,
  "avatar": "https://img1.baidu.com/it/u=4184108043,3897330245&fm=253&fmt=auto&app=138&f=JPEG?w=500&h=460",
  "target_url": "https://vote.weibo.com/h5/index/index?vote_id=2024_203989_-_8a5c9a",
  "following": true,
  "text_raw": "据四川观察报道,近日,浙江杭州一小学取消寒假作业,寒假生活以综合学习……",
  "pic_ids": [
    "16302319",
    "7481156202"
  ],
  "user_info": {
    "user_name": "sanlian"
  }
}

则 output_schema.json 可以这样定义:

{
  "component": "table",
  // 必须, 选用的组件, table 表示用表格展示
  "columns": {
    "screen_name": {
      "title": "昵称",
      // 必须,表格的表头
      "type": "string"
      // 必须,展现样式,目前支持 string、number、image、link、bool、array、object 类型
    },
    "comments_count": {
      "title": "评论数",
      "type": "number"
    },
    "avatar": {
      "title": "头像",
      "type": "image"
      // 图片
    },
    "target_url": {
      "title": "链接",
      "type": "link"
      // 链接,用户可点击
    },
    "following": {
      "title": "是否关注",
      "type": "bool"
    },
    "text_raw": {
      "title": "贴文",
      "type": "string"
    },
    "pic_ids": {
      "title": "图片 id",
      "type": "array"
      // 数组类型
    },
    "user_info": {
      "title": "用户信息",
      "type": "object"
      // 对象类型
    }
  }
}

定义每个字段的 title (表头名称)和 type (展示组件)。界面上的数据表格只展示 output_schema.json 中定义的字段。

展示效果如下: 输出

支持的组件类型(component 字段)

目前只支持 table

支持的样式类型(type 字段)

样式类型 数据类型 展示样式
string 文本 直接展示
number 数字,包括浮点型数字 直接展示
link 链接 可点击在新窗口打开此链接
image 图片 图片样式展示
bool 布尔型 展示 ❎ 或者 ✅
array 数组 展示 item 个数,可点击展开详情,json详情
object 对象 可点击展开详情,json 展示