【流程图模式】如何采集列表类型的网页
2019-11-29 11:05:02
浏览 386 次
摘要:本教程为大家介绍如何在流程图模式下采集列表类型的网页 免费下载软件
1、什么样的网页是列表类型的网页
列表类型的网页是具有相同元素的内容页按照一定的线性顺序排列分布的网页,如下图所示:
2、如何采集列表类型的网页
1)软件可以准确识别列表的情况
在列表上选中所需要采集的数据,在操作提示框内选择“提取列表中的数据”。
接着软件会自动识别列表,用户选中需要设置循环翻页,点击正确识别分页即可设置循环采集任务。
更多详情内容,请参考以下教程:
接着我们可以在这个基础上对采集字段进行设置。
更多详情内容,请参考以下教程:
2)软件无法准确识别列表的情况
有时候网页上会出现无法准确识别列表的情况,此时我们选中网页上的数据,在操作提示框内选中“修改列表识别结果”。
在跳转出来的新的页面上,按照操作提示框指示,点击列表页另一相同的元素,记住另外一个数据最好选择不同行不同列的数据,这样子方便软件进行识别。
在跳转出的新界面上:
I、如果刚刚选中的数据是正确的
用户点击提取列表中的数据,然后按照软件操作提示去设置。具体设置可参考1)后续步骤。
II、如果刚刚选中的数据是不正确的
用户可以点击修改列表识别结果,在网页上重新进行数据点选,选择另外两个数据。
然后又会跳转回上个操作步骤,用户可以参考步骤”I”进行下一步的操作。