5
新手入门 功能点介绍

【智能模式】如何创建智能模式任务

2020-10-16 17:03:04
浏览 21449 次

摘要:本教程主要给大家介绍如何创建智能模式任务 免费下载软件

智能模式是后羿采集器中最简单的模式,也是我们首推的模式,尤其适合新手用户,本教程主要给大家介绍如何创建智能模式任务。

1、创建智能模式任务的位置:

1)在采集器首页输入框:只能输入一个网址。

在此输入网址之后,软件会直接跳转到任务编辑界面,用户可在任务编辑界面继续操作。

2)在左侧工具栏新建智能模式任务

3)在首页输入框下的右侧开始采集按钮新建智能模式任务

从 2)和 3)的位置点击之后会进入智能模式任务创建的界面,用户可以在此进行更多的设置。

2、创建智能模式任务的设置

1)选择任务创建的分组

用户可以在这里选择把任务创建在哪个分组下,此外,在左侧任务栏右击任务也可以设置分组。

2)选择任务创建的名称

用户可以选择自定义输入方式,也可以按照任务分组名称+编号的方式对任务进行命名,此外,在左侧任务栏右击任务也可以对任务进行重命名。

3)选择任务创建的网址导入方式

智能模式支持手动输入多个网址、从本地文件中导入网址(支持txt、xlxs、csv)及批量生成网址。

在该窗口中输入/导入网址时,请保证格式符合如下要求:

i)  所有的网页属于同一个网站;

ii)  多个网址请用回车键分割,保证每一行只有一个网址;

iii)  所有的网页属于同一种类型,例如都是单页类型列表类型列表详情页类型

注意:不同网站的网页或者同一网站的不同类型的网页请建立不同的任务。

更多详情内容,请参考以下教程:

如何批量生成网址

3、创建智能模式任务后修改网址的方式

1)在智能采集任务打开的界面中:

这里可以对网址进行编辑,超过200个请直接修改本地文件。

注意:如果是从本地文件中导入的网址,这里的修改不会影响本地文件。

编辑之后的网址格式请符合上述第2-3)条中的要求。

4、输入网址的来源:

在智能模式下,后羿采集器可以进行自动翻页,所以输入的网址应该是已经完成了搜索操作,显示出最终需要被采集的内容的页面(或是多个需要被采集的连续页面中的第一个页面)。

例如:在文档中心搜索“智能模式”,打开对应的页面,复制网址。

分享到:
网页内容关键字提取 批量下载视频 php爬虫 批量生成网址 数据自动整理成excel 网页下载成word 批量下载图片 正则匹配邮箱 python爬虫 python数据采集
关闭