新手入门 功能点介绍 实战案例

【流程图模式】什么是行为组件

2018-11-09 15:29:45
浏览 719 次

摘要:本教程主要介绍了流程图模式下行为组件的功能及使用方法。

行为组件是后羿采集器流程图模式下使用的一组编程模块,每个组件对应于一个操作行为。

行为组件一共包含8个,具体包括:打开网页、滚动页面、点击元素、输入文字、移动鼠标到元素、提取数据、保存数据和下拉列表。

组件可以通过网页点选操作自动生成或者从下方组件窗口手动拖拽添加。如果需要删除组件,直接点击组件右上角的“X”进行删除。

下面我们来详细介绍一下每个组件。

1、“打开网页”组件

“打开网页”组件对应于打开网页的行为。

一般我们在新建流程图模式任务时就会自动生成一个“打开网页”的组件,用户也可以从下方组件窗口拖动该组件到采集规则编辑窗口。

“打开网页”组件的设置包含以下四个部分:

1)编辑网址:点击该设置可以修改打开网页的网址。

2)设置超时时间:用于设置等待网页打开的超时时间,软件默认时间为10秒,用户可以自行修改。

如果在该时间内网页正常打开,则在打开网页后继续执行后面的组件,如果在该时间内网页未正常打开,则给出超时提示,用户需确认网络是否有问题。

3)自定义Cookie:和预登录功能相同,您可以在此处输入Cookie达到预登录效果,系统默认设置不需要登录。

4)清理缓存:用于清理一些网站上的访问记录(例如清除您在网站的搜索记录等),与采集任务无太大关系,系统默认设置不清理。

2、“滚动页面”组件

“滚动页面”组件的应用场景是,当您打开网址时,一些网页信息不会直接出现在当前屏幕显示的页面中,而是需要滚动页面之后才会出现。这种情况下如果不添加“滚动页面”组件,就会导致未加载部分的数据无法被采集到。

“滚动页面”组件的具体设置如下:

滚动方式:可选择一次操作滚动一屏幕,也可以选择直接滚动到底部。

滚动次数:对应于当前滚动方式的操作次数,软件默认是滚动2次,用户也可以按照自己的需求更改滚动次数。

滚动间隔时长(秒):即两次滚动之间的间隔时长,软件默认是2秒。

3、“点击元素”组件

“点击元素”组件对应于网页点击操作,它的设置包括点击元素的XPath和是否打开新的标签。

通过辅助点选添加的“点击元素”组件会自动进行设置,我们可以直接使用,无需再手动配置。

通过手动拖拽添加的“点击元素”组件,我们可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数。

在打开新标签的选项上,我们一般选择不打开新标签,只有在我们需要提取详情页上的数据时,可以选择打开新标签。

4、“输入文字”组件

“输入文字”组件对应于网页中输入文字的操作,它的设置包括输入框的XPath和输入的文本。

在辅助点选操作过程中,我们根据软件提示流程,在操作提示框中输入文字,这种情况下组件已经设置好,我们可以直接使用,无需再手动配置。

通过手动拖拽添加的“输入文字”组件,我们可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数。

输入文本设置项中我们直接输入需要的文本即可。

注意:“输入文字”组件通常和“点击元素”组件结合使用,一般用于在网页中进行搜索操作。我们在设置“输入文字”组件后,添加一个“点击元素”组件来完成页面搜索按钮的点击操作,从而保证能够得到输入文字的搜索结果页面。

5、“移动鼠标到元素”组件

“移动鼠标到元素”组件的应用场景在于,一些网页需要鼠标移动到某个位置才会显示内容。它的设置主要是元素的XPath。

我们一般需要通过手动拖拽的方式添加该组件,可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数。

6、“提取数据”组件

“提取数据”组件对应于提取采集网页中的数据的行为。它的设置包括字段列表和提取范围。

点此深入了解如何使用提取数据组件。

 

7、“下拉列表”组件

“下拉列表”组件用于选择网页中的下拉列表。它的设置包括选择列表的XPath和选择列表的选项。

通过辅助点选操作添加的“下拉列表”组件,软件已经自动设置好了XPath,我们只需根据软件提示在操作提示框中选择列表选项即可。

通过手动拖拽添加的“下拉列表”组件,我们可以通过点击设置框右边的按钮,然后点击页面中的元素生成Xpath,也可以直接编辑XPath参数。

然后在“选择列表的选项”设置项中设置选项。

分享到: