dz论坛搬家Word下载.docx

上传人:b****3 文档编号:16719356 上传时间:2022-11-25 格式:DOCX 页数:21 大小:3.08MB
下载 相关 举报
dz论坛搬家Word下载.docx_第1页
第1页 / 共21页
dz论坛搬家Word下载.docx_第2页
第2页 / 共21页
dz论坛搬家Word下载.docx_第3页
第3页 / 共21页
dz论坛搬家Word下载.docx_第4页
第4页 / 共21页
dz论坛搬家Word下载.docx_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

dz论坛搬家Word下载.docx

《dz论坛搬家Word下载.docx》由会员分享,可在线阅读,更多相关《dz论坛搬家Word下载.docx(21页珍藏版)》请在冰豆网上搜索。

dz论坛搬家Word下载.docx

如图:

进入标题列表页及其翻页设置,列表页是包含我们要采集内容的链接网址的页面,比如XX搜索一个关键词,会列出来很多网页,这些网页我们就可以认为是标题列表页面。

在csdn上面找到我们要采集的标题列表页。

将上图的网址拷贝到我们的熊猫中,

点击开始分析按钮

如果我们需要翻页采集,那么选择是即可,不要则选择否即可。

我这里没有设置翻页采集,我选择的是否,当然这个根据实际情况来决定。

点击下一步设置,进入选择内容页的设置,随便选择一个我们要采集的链接,会发现右边我们要采集的链接全部被红框框选起来了。

那么这里我们就不要进行调整,直接再次下一步设置

来到内容页面模板管理,直接点击添加新模板,会把我们在上一步选中的链接作为模板,这地方也可以自己选择一个模板,然后把网址粘贴到添加新模板按钮左边的文本框里,点击添加新模板。

点击添加新模板之后会弹出一个设置模板的新窗口。

点击软件上方的开始分析,稍等片刻之后软件会询问你是否需要软件自动提取标题正文,一般情况下我们在这里都会选择否,如果你是采集新闻类的内容,那么你也可以选择是,这里我们选择否,如图

之后我们会发现左边款里面会出现很多我们在网页中能看见的内容,这个时候我们需要什么就勾选上采集该项即可。

这里面我们先不采集回复了,直接将主贴采集下来发布到我们的dz上面去,(后面我们会立马将主贴和回复的内容采集发布教程整理出来)。

因为我们现在要做的是整个论坛的搬家工作,所以回帖的内容我们也要全部采集,利用熊猫的父子表功能将我们需要的回帖给采集下来

截止到现在,我们的采集工作已经完成。

因为我们到时候需要用我们采集的用户名去我们的dz论坛上面注册,我们发现在dz论坛上面注册是需要邮箱的,这个时候我们可以利用熊猫的字段默认值功能,为我们的每个用户自动创建一个邮箱:

点击项目高级设置,选到我们的字段默认值,

同理,我们为我们的子表每个用户也生成一个邮箱:

点击确认出来,保存我们的项目,在确认回到主界面运行看是否采集成功。

发现我们采集已经成功,而且也生成了邮箱,下面就进入到我们的发布环节。

熊猫的发布主贴还是非常的简单的,过程就是相当于我们在网页上面如何发帖回帖的过程。

首页:

我们右击我们已经设置好的项目,点击数据模拟发布的设置进入发布页面。

进入发布机制的设置,勾选上启用web模拟发布设置

这个时候会出现如下面,因为我们是要操作论坛的搬家,所以这个时候我们需要启用熊猫的多级发布功能,

勾选完启用多级发布功能之后,下面开始进行我们的第一步设置,登录设置,因为我们是将整改论坛都移植到我们dz论坛上面,所以注册这个功能也会成为我们其中的一步设置,每次运行我们都是需要进行一个重新注册过程,所以登录这里我们需要把每次的cookie都清空,如下图所示:

进入到我们的发布设置,这里面我们就是需要进行注册我们发帖人的信息,如下图所示

(小提示:

某些看客的dz论坛注册如果有验证码,我们需要去后台将验证码给去除掉)

下面将我们的用户名密码都填写到对应的参数中,如下图所示:

接着,我们进行我们的发布测试,看看注册成功没有:

提示我们改用户名已经被注册,说明我们的注册设置是正确的,只不过这个用户名已经存在了我们的dz论坛中了。

这个时候我们进行我们的下一步设置,也就是多级发布页面管理的设置。

首先我们需要新增一个发布页面,如图所示:

因为我们上一步是注册的发帖人,那么当然现在我们需要进行发帖,那么上图的网址也就是我们的发帖的网址,这个时候我们点击设置该多级发布页面,进行下一步发布的操作,

到这里,我们在进行我们的下一步操作,多级页面的登录设置,如图:

点击验证登录,发现我们登录已经成功

至此,我们进行下一步操作,也就是模拟我们人工发帖,点击多级页面的发布设置,

并进行分析,如图:

同样,找到我们的帖子的标题和内容的参数,并将我们采集的帖子标题和内容添加进去,并进行发布测试:

这时候,我们发现我们发布测试已经成功,但是帖子中有html代码,这个不是我们想要的,这个时候我们只需要进行一步简单的操作就可以去掉这些html代码,点击到多级页面的发布机制中:

勾选使用非html代码发布

这个时候我们再次进行发布测试,发现html代码已经不见了

因为我们是论坛的整个搬家,所以我们需要将每个发帖的回帖内容肯定也是需要发布上去的,那么这个时候我们就需要记录下每个发帖的帖子id是多少,在每次点击发布测试完成之后,我们在点击获取关键值,获取到我们每次发布帖子的id是多少?

这个时候虽然我们已经采集下来这个网站,但我们只是需要这个id的数字,所以我们再去对这个采集下来的内容进行一个修缮,点击对结果的修缮,进如到下面的设置,如图

到现在为止,我们主贴的发布已经全部完成。

下面进行我们回帖的发布设置点击确认出来,再次新增一个发布页面,因为我们如果想给一遍帖子进行回帖,必须是要先有账号,那么过程也是先注册,登录,在进行回帖的设置所以我们这个新增的发布页面填写的网址还是我们的注册网址,如图:

点击设置该多级发布页面的设置,进入我们的下一步操作:

进入到多级页面发布的设置操作,同理,分析注册页面,进行我们的回帖人注册操作,如图:

点击发布测试,发现我们已经注册成功(这个提示只是说明我们的用户名已经被注册过了,不会影响我们发布的时候注册新用户)。

至此,我们回帖人的注册也操作结束,下面我们就需要对每个主贴进行回帖,进入到下一个环节的操作,继续新增一个发布页面,这个时候就需要用我们每个主贴对应的网址了:

这个时候我们就可以点击设置该发布页面进行里面的操作了,如图:

下面进入多级页面的登陆设置,继续将登陆页面网址拷贝进来,并填上相对应的参数值:

点击验证登录,发现我们登录已经成功:

下面就进入到我们的最后一步操作了,也就是回帖的操作,点击多级页面发布设置,分析我们的网址,并填写我们的回帖内容,如图:

点击发布测试,发现我们回帖的发布已经成功。

至此,我们的发布过程已经全部结束,下面我们保存我们的发布设置。

去运行一下我们的项目看看有没有发布到我们的dz论坛上面

访问我们发的贴数,发现我们的发布已经完全成功了,并且也有回复上去了。

到此为止,熊猫发布帖子已经结束,是不是感觉我们的熊猫软件发布起来非常的简单,非常的容易上手呢。

(偷偷说一下,熊猫软件现在是免费使用了哦)。

注意事项:

1.主贴参数的获取

2.取消登陆和注册的验证码

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 军事政治

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1