5
新手入门 功能点介绍

【流程图模式】如何采集列表类型的网页

2019-12-24 20:53:10
浏览 784 次

摘要:本教程为大家介绍如何在流程图模式下采集列表类型的网页 免费下载软件

1、什么样的网页是列表类型的网页

列表类型的网页是具有相同元素的内容页按照一定的线性顺序排列分布的网页,如下图所示:

2、如何采集列表类型的网页

1)软件可以准确识别列表的情况

点击列表中的任一行,软件会自动识别出列表并给出提示,选择“提取列表中的数据”。

软件会自动识别当前页面的分页按钮,我们可以根据提示设置自动翻页操作。

更多详情内容,请参考以下教程:

接下来我们可以对采集字段进行设置。

更多详情内容,请参考以下教程:

如何对采集字段进行配置

2)软件无法准确识别列表的情况

点击列表中的任一行,如果软件自动识别的列表不正确,我们可以在操作提示框内选则“修改列表识别结果”。

然后按照操作提示框指示,点击列表中另一个相同的元素。建议点击另一个元素时最好选择不同行的元素,从而让软件识别更加准确。

在修改列表识别结果过程中,存在以下两种情况:

第一种情况:修改之后列表识别结果是正确的

此时我们可以在操作提示中选择提取数据或者点击列表操作。具体设置可参考上述1)的后续步骤。 

第二种情况:修改之后的列表识别结果仍然不正确

我们可以再一次修改列表识别结果,此时修改列表识别结果需要点选列表中的两个元素,我们仍然建议您选择不同行的两个元素。

之后我们会回到显示列表识别结果步骤,然后我们可以按照上文所示进行下一步的操作。

分享到:
网页下载成word 批量生成网址 php爬虫 python爬虫 python数据采集 正则匹配邮箱 网页内容关键字提取 批量下载视频 批量下载图片 数据自动整理成excel
关闭