logo
icon

集蜂云Docs

集蜂云
控制台
市场
设置
费用
采集器
运行与构建
输入与输出
构建
任务
发布
分享
开发
快速开始
创建采集器
输入
输出
采集队列
键值对
SDK
代码示例
数据-存储
数据-数据集
数据-键值对
数据-采集队列
代理
集成
webhook
企业微信
飞书
钉钉
邮箱
与其他采集器
收益
API

运行

运行你的第一个采集器

在运行采集器之前,可以从市场挑选一个公开的采集器,或者自己构建一个采集器。为了简单起见,我们先从市场选择一个免费的采集器。下面以采集微博数据为例。

开始之前,需要注册一个账号。账号里每月都有免费的额度。

1. 选择一个采集器

登录到系统,然后选择市场,选择微博采集器

市场

2. 配置用户

打开微博,找一个你喜欢的微博用户,点进去该用户的微博首页,并复制微博链接。例如,我选择了今日俄罗斯 RT 微博

将微博用户的主页链接复制到采集器的配置项中,然后点击 运行微博2

3. 等待运行结果

采集器运行需要一定的时间。平台会将这次运行分配到一台机器上,拉取镜像并启动。如果不去下载图片、视频的话,该次采集,很快就会有结果。 您可以进行数据预览、采集日志查看等操作。 微博3

4. 数据导出

最后,可以将采集到的数据导出成 JSON 或者 CSV ,也可以通过 API 获取数据。 微博4