新手入门 功能点介绍 实战案例

【智能模式】如何选择页面类型和设置分页

2019-04-23 19:44:38
浏览 754 次

摘要:本教程主要给大家介绍在智能模式中如何设置页面类型和分页条件。 免费下载软件

在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也出现了偏差(我们会一直优化智能识别功能)。此时您可以手动选择页面类型和设置分页,从而辅助软件识别出正确的结果。

1、选择页面类型:

选择页面类型的菜单位置如下图所示。

如果是单页类型的网页,用户可以直接选择单页识别。

关于单页类型的详细介绍请戳这里

如果是选择列表类型的网页,用户可以点击自动识别让软件去识别列表,如果自动识别效果不佳,还可以通过手动点选列表的方式,有编辑基础的用户还可以通过编辑列表xpath的方式来识别列表。

关于列表类型的详细介绍请戳这里

2、分页设置:

分页设置的菜单位置如下图所示。

具体设置包括:

(1)分页按钮

i:自动识别分页:

点击软件能自动识别网页上的分页按钮

ii:点选分页按钮:

直接在网页中点击下一页按钮,软件会根据用户的点选操作,识别该按钮的位置。

iii:编辑分页XPath:

适合了解XPath的用户,通过编写XPath,让软件识别网页中下一页按钮的位置。

(2)瀑布流分页(滚动加载):

适合没有下一页按钮的网页,软件自动滚动加载内容。例如今日头条这种信息流就适合设置瀑布流分页(滚动加载)。

(3)不启用分页

适合没有下一页的网页,例如单页类型的网页。

(4)瀑布流+点选分页按钮:

适合滚动加载才会显示出下一页按钮的网页,或者已经显示了下一页按钮,但是当前网页内容未展示完毕,需要滚动加载之后才会显示当前网页的全部内容。

3、最大分页限制

(1)分页限制

如果需要采集到最后一页才停止数据,那么就选择不限制分页,如果只需要采集一部分的页数,那就在最大分页数中去设置。

(2)设置任务停止条件

在分页设置中,我们还可以设置任务停止条件,当字段满足某一条件时,停止任务采集。

分享到: