新手入门 功能点介绍 实战案例

【流程图模式】什么是行为组件

2019-04-23 20:29:04
浏览 3361 次

摘要:本教程主要介绍了流程图模式下行为组件的功能及使用方法。 免费下载软件

行为组件是后羿采集器流程图模式下使用的一组编程模块,每个组件对应于一个操作行为。

行为组件一共包含10个,具体包括:打开网页、点击元素、输入文字、滚动页面、移动鼠标到元素、下拉框、验证码识别、提取数据、定时等待以及跳出循环。

组件可以通过网页点选操作自动生成或者从下方组件窗口手动拖拽添加。如果需要删除组件,直接点击组件右上角的“X”进行删除。

下面我们来详细介绍一下每个组件。

1、“打开网页”组件

“打开网页”组件对应于打开网页的行为。

一般我们在新建流程图模式任务时就会自动生成一个“打开网页”的组件,用户也可以从下方组件窗口拖动该组件到采集规则编辑窗口。

“打开网页”组件的设置包含以下三个部分:

1)编辑网址:点击该设置可以修改打开网页的网址。

2)设置超时时间:用于设置等待网页打开的超时时间,软件默认时间为1秒,用户可以自行修改。

如果在该时间内网页正常打开,则在打开网页后继续执行后面的组件,如果在该时间内网页未正常打开,则给出超时提示,用户需确认网络是否有问题。

3)自定义Cookie:和预登录功能相同,您可以在此处输入Cookie达到预登录效果,系统默认设置不需要登录。

2、“点击元素”组件

“点击元素”组件对应于网页点击操作。

“点击元素”组件的设置包含以下三个部分:

1)输入或点选生成Xpath:

2)是否打开新标签:

在打开新标签的选项上,我们一般选择不打开新标签,只有在我们需要提取详情页上的数据时,可以选择打开新标签。

3)是否单击:

大部分的网站只需要点击一次就能跳转,如果遇到需要点击两次才能跳转的网站,需要勾选双击。

4)点击元素组件的实际应用:

通过辅助点选添加的“点击元素”组件会自动进行设置,我们可以直接使用,无需再手动配置。

通过手动拖拽添加的“点击元素”组件,我们可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数,选择不打开新标签,单击。

3、“输入文字”组件

“输入文字”组件对应于网页中输入文字的操作。

“输入文字”组件的设置包含以下三个部分:

1)输入或点选生成Xpath:

2)输入文本:

3)是否敲回车:

一般的输入框是不需要敲回车,如果遇上需要敲回车才能使用的输入框,要勾选此功能。

4)输入文字组建的实际应用:

在辅助点选操作过程中,我们根据软件提示流程,在操作提示框中输入文字,这种情况下组件已经设置好,我们可以直接使用,无需再手动配置。

通过手动拖拽添加的“输入文字”组件,我们可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数,输入文本设置项中我们直接输入需要的文本即可,敲击回车部分不需要另外设置。

注意:“输入文字”组件通常和“点击元素”组件结合使用,一般用于在网页中进行搜索操作。我们在设置“输入文字”组件后,添加一个“点击元素”组件来完成页面搜索按钮的点击操作,从而保证能够得到输入文字的搜索结果页面。

4、“滚动页面”组件

“滚动页面”组件的应用场景是,当您打开网址时,一些网页信息不会直接出现在当前屏幕显示的页面中,而是需要滚动页面之后才会出现,如果不添加“滚动页面”组件,就会导致未加载部分的数据无法被采集到。流程图中滚动组件的功能应用对应智能模式翻页中的瀑布流分页(滚动加载)。

“滚动页面”组件的设置包含以下三个部分:

1)滚动方式:可选择一次操作滚动一屏幕,也可以选择直接滚动到底部。

2)滚动次数:对应于当前滚动方式的操作次数,软件默认是滚动1次,用户也可以按照自己的需求更改滚动次数。

3)滚动间隔时长(秒):即两次滚动之间的间隔时长,软件默认是1秒,用户也可以按照自己的需求更设置间隔时长。

5、“移动鼠标到元素”组件

“移动鼠标到元素”组件的应用场景在于,一些网页需要鼠标移动到某个位置才会显示内容。

它的设置主要是元素的XPath。

我们一般需要通过手动拖拽的方式添加该组件,可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数。

6、“下拉框”组件

“下拉框”组件用于选择网页中的下拉列表。

“下拉框”组件的设置包含以下两个部分:

1)输入或点选生成Xpath:

2)下拉框选项:

3)下拉框组件的实际应用:

通过辅助点选操作添加的“下拉列表”组件,软件已经自动设置好了XPath,我们只需根据软件提示在操作提示框中选择列表选项即可。

通过手动拖拽添加的“下拉列表”组件,我们可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数,然后在“选择列表的选项”设置项中设置选项。

7、“验证码识别”组件

“验证码识别”组件应用于在任务采集过程中遇到网站反爬出现验证码识别的情况,验证码识别组件不单独使用,要其他组件搭配使用。

点此了解更多验证码识别的具体应用。

8、“提取数据”组件

“提取数据”组件对应于提取采集网页中的数据的行为。它的设置包括字段列表和提取范围。

点此深入了解如何使用提取数据组件。

9、“定时等待”组件

“定时等待”组件用于组件之间插入的计时等待过程,在网页加载较慢时,可以设置一个定时等待的组件。

定时等待组件的设置参数为等待时长,以秒为单位。系统默认定时等待的时间为1秒,用户可以根据自己需求设置等待时长。

10、“跳出循环”组件

“跳出循环”通常嵌套于“循环”组件内部,用来停止当前的循环操作。

通常情况下,“循环”组件会在设置好的循环条件满足时循环执行任务直到循环条件结束,如果我们希望在某些条件下提前跳出循环操作,可以设置一个“判断”组件和一个“跳出循环”组件。

 

分享到: