运行
运行你的第一个采集器
在运行采集器之前,可以从市场挑选一个公开的采集器,或者自己构建一个采集器。为了简单起见,我们先从市场选择一个免费的采集器。下面以采集微博数据为例。
1. 选择一个采集器

2. 配置用户
打开微博 ,找一个你喜欢的微博用户,点进去该用户的微博首页,并复制微博链接。例如,我选择了今日俄罗斯 RT
将微博用户的主页链接复制到采集器的配置项中,然后点击 运行:
3. 等待运行结果
采集器运行需要一定的时间。平台会将这次运行分配到一台机器上,拉取镜像并启动。如果不去下载图片、视频的话,该次采集,很快就会有结果。 您可以进行数据预览、采集日志查看等操作。
4. 数据导出
最后,可以将采集到的数据导出成 JSON 或者 CSV ,也可以通过 API 获取数据。
Last modified: 16 十月 2024