集蜂云 Doc Help

运行

运行你的第一个采集器

在运行采集器之前,可以从市场挑选一个公开的采集器,或者自己构建一个采集器。为了简单起见,我们先从市场选择一个免费的采集器。下面以采集微博数据为例。

1. 选择一个采集器

登录到系统,然后选择市场 ,选择微博采集器

市场

2. 配置用户

打开微博 ,找一个你喜欢的微博用户,点进去该用户的微博首页,并复制微博链接。例如,我选择了今日俄罗斯 RT

微博

将微博用户的主页链接复制到采集器的配置项中,然后点击 运行

微博2

3. 等待运行结果

采集器运行需要一定的时间。平台会将这次运行分配到一台机器上,拉取镜像并启动。如果不去下载图片、视频的话,该次采集,很快就会有结果。 您可以进行数据预览、采集日志查看等操作。

微博3

4. 数据导出

最后,可以将采集到的数据导出成 JSON 或者 CSV ,也可以通过 API 获取数据。

微博4

Last modified: 20 七月 2024