5
新手入门 功能点介绍 实战案例

如何采集淘宝店铺商品信息

2018-09-27 13:24:05
浏览 96 次
下载规则

摘要:本文介绍使用 后羿采集软件 采集淘宝店铺商品信息(以某店铺女装为例)的方法 免费下载软件

后羿采集器(http://www.houyicaiji.com)是一款免费的智能网页采集器,无需编程和配置规则,所有人都可以使用的网页采集软件。和其他采集器相比,具有以下特点:

1、采集和数据导出无限制,免费放心使用;

2、推荐使用智能模式采集,软件会自动分析并提取列表和表格数据,同时自动识别分页,全程自动化;

3、首款支持所有操作系统的网页采集软件,包括windows、Linux和Mac

4、任务云端保存,一个账号多终端操作

 

本文介绍使用 后羿采集器 的智能模式,自动采集淘宝店铺商品信息(以某店铺女装为例)的方法,请先从官网下载并在电脑上安装好后羿采集器~

采集网址

https://shop109847364.taobao.com/search.htm?spm=a1z10.1-c-s.0.0.73c9139bShdB6T&search=y

使用功能点

1、智能识别列表页数据和分页

2、深入列表页链接,同时采集详情页数据

3、采集数据包括:商品名称、url、价格、销量、评论数、图片链接等

采集步骤

步骤1:创建采集任务

打开后羿采集器,选择“智能模式”,点击“创建任务”。

步骤2:输入店铺全部商品列表第一页链接

1、在弹出的对话框中,输入链接:https://shop109847364.taobao.com/search.htm?spm=a1z10.1-c-s.0.0.73c9139bShdB6T&search=y。点击“立即创建”,稍等片刻后,软件会自动分析列表页的商品数据,可以修改字段名、删除不需要的字段等。

 

2、点击选择“自动识别分页”

步骤3:深入链接采集,提取商品详情页数据

1、点击底部字段中商品链接那一栏,然后点击“深入此链接采集”,等商品详情页面加载完成。

 

2、在商品详情页点选要采集的数据,方法是点击“添加字段”,然后在页面中点击要提取的数据。

步骤4:开始采集

点击“开始采集”,在弹出的对话框中可以设置浏览器版本、图片下载、屏蔽广告等,点击“启动”,可以看到采集过程日志和采集的数据。

P.S. 最后采集的数据包括了列表页和详情页的提取数据

步骤5:导出数据

点击“停止”或者等所有数据采集完,点击“导出数据”,选择导出文件类型,导出完成后可以查看所有导出的数据啦。

 

P.S. 该种方法可以快速采集淘宝商品。如遇反爬,也可以使用神箭手提供的成熟的淘宝商品云爬虫(自动接入高质量私密代理IP):http://www.shenjian.io/index.php?r=market/product&product_id=500078

分享到: