5
新手入门 功能点介绍

【智能模式】【流程图模式】如何设置智能策略

2019-12-16 18:52:55
浏览 387 次

摘要:本教程为大家介绍如何设置智能策略功能。 免费下载软件

智能策略包含代理设置、智能切换和手动切换,这部分功能主要是用来智能处理采集过程中遇到的各种问题。

在编辑任务界面,点击右下角“开始采集”按钮,在弹出的设置框中,点击“智能策略”选项可以切换到设置界面。

1、代理设置

1)代理类型

I、代理IP(由芝麻代理提供)

该代理为通过芝麻代理提供的接口,用户可以直接在软件内购买。

代理的区域可以进行设置,包括全国混拨、省份混拨或者指定城市。

II、自定义代理

如果需要使用自己的代理,请点击“立即设置”,然后在设置窗口中按要求进行设置。(注意:自定义代理按顺序循环切换)

2)切换条件

I、按照时间切换

代理根据时间进行切换,例如您设置切换条件为“每隔:3分钟”,那么每隔3分钟就会切换一次代理,同时会消耗一个代理IP 。

II、按照文本切换

根据文本进行切换,例如您设置切换条件为“当页面中出现该文本:后羿”,那么网页中出现对应的文本时,就会切换一次代理,同时消耗一个代理IP。

2、智能切换

一般的采集任务,用户直接按照软件默认的智能设置就行,不用另外设置条件。

3、手动切换

如果遇到的网页比较特殊,智能切换不起作用,此时可以设置手动切换。

I、请求等待时间

一些网页打开的时间较慢,有时候会影响采集效果,用户可以设置一个等待时间,能有效提高采集的质量。系统默认等待时间为1秒,用户可以根据自己的需求进行修改。

II、运行中检测验证码

软件一般会自动识别验证码,遇到特殊情况可以手动设置遇到特定文本时自动弹出验证码识别,例如“当页面中出现该文本:后羿”时会直接弹出验证码识别的提示。

III、运行中检测登录提示

需要登录才能采集数据的网站,在运行过程中登录有可能会失效,或者有些网站采集到一定量的数据之后会提示登录,勾选此功能,软件在运行过程中如果遇到登录失效或需要登录的情况会弹出提示登录。

IV、仅采集页面可见内容

有一些网站会将无效的数据混在有效的数据之中,采集数据的时候会出现很多无效的字符,且这些无效字符是隐藏的,这种情况下我们就可以勾选这个设置,只采集页面可以的内容。

注意:如果采集的网站没有隐藏无效字符的设置,勾选此项会造成数据采集不全或者数据无法采集,用户在使用此项功能时需要谨慎。

V、逐行滚动网页预加载

有些网站需要滚动到一定位置之后内容才能显示,否则无法采集到数据,这时候可以勾选此项功能。但是需要注意的是,勾选此项功能的时候会影响采集速度,用户需要谨慎使用功能。

VI、定时切换浏览器版本

用户就可以自定义设置切换版本的时间周期,设置时间周期可以是30秒~10分钟,软件会按照设置周期自动切换各种浏览器版本,用户无需自行选择具体版本。

VII、定时清除cookie

用户可以自定义设置清除cookie的时间周期,设置时间周期可以是30秒~10分钟,软件会按照设置周期定时清除网页Cookie。

分享到: