新手入门 功能点介绍 实战案例

【智能模式】基本操作流程

2018-09-09 21:26:18
浏览 1152 次

摘要:本教程主要给大家介绍一下智能模式的基本操作流程。

如果您已经看完了后羿采集器智能模式的第一个采集案例,想必您对其已经有了初步的了解,这里我们再来详细介绍一下智能模式的基本操作流程。

(1)输入正确的网址

输入了正确的网址,这个采集任务就成功了一半。

后羿采集器支持单网址和多网址采集,也支持从本地TXT文件中导入网址。

点此深入了解如何正确地输入网址。

(2)选择页面类型及设置分页

在智能模式下,后羿采集器会默认按照列表类型进行识别,如果您输入的是单页类型,此时会出现识别错误;或者由于其他原因,即使是列表类型的网页,智能识别也出现了偏差(我们会一直进行优化智能识别功能)。此时您可以手动选择页面类型和设置分页,从而辅助软件识别出正确的结果。

点此深入了解如何选择页面类型和设置分页。

关于上文提到的页面类型,您可以分别点击下面的链接了解具体的信息:

单页类型

※ 列表页类型

列表页+详情页类型

(3)预登录

在数据采集过程中,我们有时候会遇到需要登录才能查看内容的网页,这时我们需要用到预登录功能,登录成功之后就能进行正常的数据采集。

点此深入了解如何采集需要登录才能查看的网页。

(4)切换浏览器模式

在数据采集过程中,可以使用不同的浏览器模式来优化采集效果,具体使用场景需要根据实际情况来判断。

点此了解如何切换浏览器模式。

(5)设置提取字段

智能模式下,软件会自动识别网页中的数据并展示到采集结果预览窗口,用户可以根据自己的需求对字段进行设置。

点此深入了解如何对采集字段进行设置。

(6)采集任务的基础设置

在启动采集任务之前,我们需要对采集任务进行设置,包括一些基础设置和防屏蔽设置。

点此深入了解如何对采集任务进行设置。

(7)采集任务的高级设置:定时采集

定时采集功能属于采集任务的高级设置,该功能可实现在用户设置的时间周期内,在固定的时间点开启和停止数据采集任务。如果您设置了定时采集,请保证软件一直处于工作状态(不能关机)。

点此深入了解定时采集功能。

(8)采集任务的高级设置:自动入库

自动入库功能属于采集任务的高级设置,该功能可实现在数据采集的同时,自动发布采集结果到数据库,而无需等到任务结束才能够导出数据。自动入库功能搭配定时采集功能,能够极大的节约时间,提高工作效率。

点此深入了解自动入库功能。

(9)采集任务的高级设置:下载图片

下载图片属于采集任务的高级设置,该功能可以实现在采集数据的同时,将网页上的图片下载到本地。

点此深入了解下载图片功能。

(10)查看采集结果及导出数据

如果您未使用自动入库功能,则需要手动导出采集结果。

完成上述设置之后,我们就可以启动采集任务了。在设置任务的过程中,采集任务会被自动保存,在采集任务结束之后,用户可以查看采集结果并导出数据。

后羿采集器对采集结果导出不做任何限制,无需积分,完全免费,大家可以放心使用。

点此深入了解如何查看采集结果及导出数据。

分享到: