5
新手入门 功能点介绍

如何采集天眼查企业列表

2019-12-12 15:48:04
浏览 1385 次

摘要:本文具体讲解如何使用后羿采集器智能采集天眼查企业数据 免费下载软件

天眼查专注服务于个人与企业信息查询工具。本文使用后羿采集器的智能模式,具体讲解如何批量自动采集天眼查网站的企业信息。

 

在开始采集前,请先从官网下载并安装好后羿采集器最新版,支持所有操作系统(包括Windows、Mac和Linux)。

 

采集网址:https://sjz.tianyancha.com/search

采集数据:企业名称、联系电话、法定代表人、注册资本、经营状态、位置、注册时间、评分

使用功能点

1、智能模式,自动识别列表数据

2、手动点选分页按钮

3、自定义修改要提取的字段

4、修改采集的数据

 

采集详解

步骤1,输入采集的网址,智能采集

 

步骤2,等网页加载完,软件会自动识别要提取的列表数据

 

在下面的字段列表中,点击每个字段右边的下拉按钮,可以修改字段名称、删除不需要的字段等。点击列表右上角的”添加字段“,可以增加更多要提取的数据字段:

 

最后要采集的字段如下图所示:

 

步骤3,修改采集的数据

我们可以看到,自动识别的法定代表人字段,数据中多了一些不需要的内容:法定代表人:,这一步我们就通过数据处理删掉不需要的内容。

点击要修改的字段下拉框,选择”数据处理“,增加一个处理过程(文本替换),将”法定代表人:“替换为空:

 

 

 

步骤4,手动选择分页元素

点击下方左侧的”自动识别分页“,选择”手动选择分页“->”选择分页元素”,然后在网页中点选下一页按钮:

 

步骤5,保存后,开始采集,导出数据

采集开始后,停止采集或者等采集结束后,一键导出采集的数据到本地文件或者数据库中:

 

 

下面是导出的数据文件截图:

 

大家可以发现,采集的企业名称有的会不对。这是因为天眼查采取了字体反爬,有问题欢迎查看客户端底部的qq群加群讨论哦~

 

另外,需要企业数据的童鞋,也可以直接在神箭手官网购买数据或者通过API获取http://www.shenjian.io/index.php?r=market/search&keyword=%E4%BC%81%E4%B8%9A

分享到: