新手入门 功能点介绍 实战案例

【流程图模式】基本操作流程

2018-09-09 23:38:28
浏览 1084 次

摘要:本教程主要介绍了流程图模式的基本操作流程。

如果您已经看完了后羿采集器流程图模式的第一个采集案例,想必您对其已经有了初步的了解,这里我们再来详细介绍一下流程图模式的基本操作流程。

(1)输入正确的网址

流程图模式对输入网址的要求没有智能模式那么严格,但是您仍然需要按照软件的要求输入正确的网址格式。

后羿采集器支持单网址和多网址采集,也支持从本地TXT文件中导入网址。

点此深入了解如何正确地输入网址。

(2)预登录

在数据采集过程中,我们有时候会遇到需要登录才能查看内容的网页,这时我们需要用到预登录功能,登录成功之后就能进行正常的数据采集。

点此深入了解如何采集需要登录才能查看的网页。

(3)拖拽组件搭建采集规则

后羿采集器团队将复杂的采集编码流程进行可视化封装,让开发采集规则的过程像搭积木一样简单。

在流程图模式中,组件分为行为组件和流程组件,组件是构成流程图采集任务的最基础的元素。

点此了解什么是行为组件

点此了解什么是流程组件

(4)网页点选搭建采集规则

流程图模式支持可视化网页点选操作,用户根据软件给出的引导提示,像浏览网页一样点击相关元素,即可生成采集规则。

操作流程如下图所示:

(5)设置提取字段

在流程图模式中,我们通过使用“提取数据”组件来设置提取字段。用户可以通过提示点击自动生成该组件或者从组件窗口中直接拖拽该组件。

点此深入了解如何使用提取数据组件。

(6)采集任务的基础设置

在启动采集任务之前,我们需要对采集任务进行设置,包括一些基础设置和防屏蔽设置。

点此深入了解如何对采集任务进行设置。

(7)采集任务的高级设置:定时采集

定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。

如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。

点此深入了解定时采集功能。

(8)采集任务的高级设置:自动入库

自动入库功能属于采集任务的高级设置,该功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。

自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。

点此深入了解自动入库功能。

(9)采集任务的高级设置:下载图片

下载图片属于采集任务的高级设置,该功能可以实现在采集数据的同时,将网页上的图片下载到本地。

点此深入了解下载图片功能。

(10)查看采集结果及导出数据
如果您未使用自动入库功能,则需要手动导出采集结果。

完成上述设置之后,我们就可以启动采集任务了。在设置任务的过程中,采集任务会被自动保存,在采集任务结束之后,用户可以查看采集结果并导出数据。

后羿采集器对采集结果导出不做任何限制,无需积分,完全免费,大家可以放心使用。

点此深入了解如何查看采集结果及导出数据。

分享到: