5
新手入门 功能点介绍

【智能模式】如何设置深入采集

2019-12-24 14:08:33
浏览 40655 次

摘要:本教程介绍了什么是深入采集以及如何进行深入采集的设置 免费下载软件

智能模式会自动识别网页中的列表数据,如果我们想要采集列表页对应的详情页中的数据,可以使用深入采集功能。所谓深入采集就是通过当前页面的链接进入对应详情页进行采集。

1、点击“深入采集”按钮

当列表页上只有一个链接字段时,点击任务操作栏上的“深入采集”按钮会打开链接字段中的第一个链接对应的详情页。我们可以在此页面上进行采集规则的设置,其他详情页会自动根据该页面的设置规则进行采集。

如果存在多个链接字段,点击“深入采集”按钮时会弹出提示框,我们需要选择一个链接字段进行深入采集。

此外,如果我们已经选中了某一个链接字段(点击字段名称可以选中该字段),点击“深入采集”按钮会直接对该链接字段进行深入采集。

2、直接点击链接字段中的某一条链接

使用“深入采集”按钮时,默认打开第一条链接对应的详情页,有的时候可能存在第一条数据为广告的情况,此时我们可以直接点击某一条链接进行深入采集。

点击链接字段中的任意一条链接,都可以打开对应的详情页,然后可以在该页面上进行深入采集的规则设置。其他页面会自动按照该页面设置的规则进行采集。

分享到:
网页内容关键字提取 网页下载成word 批量下载图片 批量下载视频 python数据采集 批量生成网址 数据自动整理成excel php爬虫 python爬虫 正则匹配邮箱
关闭