5
新手入门 功能点介绍

【流程图模式】如何设置采集范围

2020-01-04 19:03:50
浏览 20211 次

摘要:本教程为大家介绍如何在流程图模式中设置采集范围。 免费下载软件

不同于智能模式可以直接设置采集范围,流程图模式采集范围的设置比较复杂一些。

1、只设置结束页面,不设置开始页面的采集范围设置

这种设置比较简单,不管是有分页按钮的网页、瀑布流加载的网页还是瀑布流+分页加载的网页,都只需要选中翻页循环设置,然后在翻页次数那里设置自定义次数,用户想要在哪个页数停止,就选择填相应的页数。

1)分页按钮

2)瀑布流分页

3)瀑布流+分页按钮

2、设置开始采集页面,不设置结束页面的采集范围设置

1)网址会随着页码的变动而变动的网站

用户可以直接复制新的开始采集的网址,在页面上修改网址。

2)网址不会随着页码的变动而变动的网站

针对这种网站,我们点击页面上的分页按钮,在操作提示框内选择点击“循环点击该元素”按钮,此时软件上会设置一个新的翻页循环按钮。

假设之前的任务在第3页停止,用户要从第4页开始采集,则可以在这个翻页循环上设置自定义翻页次数“4”。

3)网址不会随着页码的变动而变动,但是页码可以通过输入的方式直接跳转的网站

有一些网站的网址虽然不会随着页码的变动而变动,但是页码部分有输入框,可以直接输入页数跳转到相应的页码,如以下这种网站:

针对这种网站,我们点击页面上的输入框,在跳转出的操作提示框内输入想要跳转的界面,此处用第4页来举例,在输入框内填入数字“4”之后,点击确定,软件上会出现一个输入文字组件。

我们再点击页面上“go”按钮,在跳转出来的提示操作框上选择“点击一次该元素”按钮,页面就会跳转到第4页去了。

3、设置开始采集页面及结束页面的采集范围设置

这种采集范围的设置,就是结合以上方法1和方法2的设置,这里不多做赘述。

分享到:
python数据采集 php爬虫 数据自动整理成excel 网页内容关键字提取 批量生成网址 批量下载图片 网页下载成word 批量下载视频 正则匹配邮箱 python爬虫
关闭