在运行采集器之前,可以从市场挑选一个公开的采集器,或者自己构建一个采集器。为了简单起见,我们先从市场选择一个免费的采集器。下面以采集微博数据为例。
开始之前,需要注册一个账号。账号里每月都有免费的额度。
打开微博,找一个你喜欢的微博用户,点进去该用户的微博首页,并复制微博链接。例如,我选择了今日俄罗斯 RT
将微博用户的主页链接复制到采集器的配置项中,然后点击 运行:
采集器运行需要一定的时间。平台会将这次运行分配到一台机器上,拉取镜像并启动。如果不去下载图片、视频的话,该次采集,很快就会有结果。 您可以进行数据预览、采集日志查看等操作。
最后,可以将采集到的数据导出成 JSON 或者 CSV ,也可以通过 API 获取数据。