5
新手入门 功能点介绍 实战案例

如何采集东方财富网股吧发帖

2018-09-27 10:48:28
浏览 76 次
下载规则

摘要:使用后羿采集器的智能模式,教会你如何免配置自动化采集论坛发帖。 免费下载软件

东方财富股吧,是专业的股票论坛社区。股民朋友可以在这里畅所欲言,分析讨论股票名的最新动态。

 

通过采集股吧里的网友发帖,可以掌握实时行情评论和个股交流,了解股市现状和发展趋势等。本文便使用后羿采集器的智能模式,教会你如何免配置自动化采集这类论坛发帖。

后羿采集器是一款全新的人工智能网页数据采集软件,通过后羿的智能采集,可以免编程免配置进行网页数据采集。用户只需要输入列表或者表格网页链接,软件可以自动识别提取数据、自动识别分页,不需要额外的操作即可快速采集。

 

在开始采集之前,请先从官网下载并在电脑上安装好后羿采集器最新版,windows、mac和linux都支持的哦~

 

采集网址:http://guba.eastmoney.com/jj.html

采集数据:发帖标题、链接、作者、子贴吧名、点击、回复、发表日期、最后更新、内容

使用功能点

1、智能采集,自动识别列表数据和分页;

2、深入内容页链接采集发帖内容;

3、自定义修改字段名称、删除字段等

 

采集步骤

步骤1,打开后羿采集器,输入采集的网址,开始智能采集

P.S. 也可以点击下方的智能采集->开始采集,创建一个智能采集任务。支持输入多个贴吧的网址同时采集哦~

 

步骤2,等待页面加载完成,会自动识别提取列表中的数据和分页

 

我们可以删除不需要采集的字段,修改字段名称等:

 

 

步骤3,选中帖子链接字段列头,然后点击“深入链接采集”,点选要从内容页采集的数据字段

 

 

这里我们要采集的是发帖内容的html,所以修改字段的取值属性为内部HTML:

 

步骤4,保存后,开始采集,导出采集的数据

数据可以导出到本地文件(包括excel、csv和html等),也可以导出到您的数据库中:

 

下面是导出的数据文件截图:

 

分享到: