ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:18.29KB ,
资源ID:5318544      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/5318544.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案1.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案1.docx

1、南开21春学期网络爬虫与信息提取在线作业辅导材料附答案1南开21春学期(1709-2103)网络爬虫与信息提取在线作业提示:南开大学课程学习已经开启,本套试卷是课程学习辅导资料,只作参考学习使用!一、单选题 (共 20 道试题,共 40 分)1.下列说法错误的是()A.小程序的请求极其简单,基本上没有验证信息B.用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多。C.如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据。D.小程序的反爬虫能力比网页版的低很多。使用小程序的接口来爬数据,能极大提高爬虫的开发效率。提问:仔细分析上述试题,

2、并从选项中选择一项,填写在答题卡上参考答案是:B2.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。A.metaB.headC.headerD.body提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:A3.启动MongoDB使用命令mongod -() usr/local/etc/mongoD.confA.configB.installC.startD.begin提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:A4.HTTP常用状态码表明服务器不允许访问那个资源的是()A.500B.503C.403D.405

3、提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:C5.Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()A.空B.空列表C.空元组D.不返回提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:B6.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成A.列表B.元组C.字典D.集合提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:A7.在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?()A.spiders文件夹B.item.pyC.pipeline.pyD.s

4、ettings.py提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:C8.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题A.sB.cC.dD.r提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:D9.python中可以用来将图片中的文字转换为文本的第三方类库是A.lxmlB.requestsC.beautifulsoupD.pytesseract提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:D10.在Linux中哪个命令是添加权限的()A.chmodB.sudoC.cpD.mkdir提问:仔细分析上

5、述试题,并从选项中选择一项,填写在答题卡上参考答案是:A11.使用python定制mitmproxy,下面的语句请求的是()。req.headersUser-AgentA.headersB.文本内容C.目标网站D.user-agent提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:D12.PyMongo中逻辑查询表示小于等于的符号是()A.$gtB.$ltC.$gte$lte提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:C13.Python中若定义object=1, 2, 3, 4, 5,则print(object-4)输出()A.NULLB.2C

6、.4D.程序报错提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:B14.Python中Object=obj_1:1,obj_2:2,则Objcet.get(boj_3,3)是()A.1B.2C.3D.无输出提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:C15.PyMongo中的查找方法的参数是哪种数据结构()A.列表B.元组C.字典D.集合提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:C16.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()A.列表B.元组C.字典D.集合提问:仔细

7、分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:B17.Redis是一个开源的使用()语言编写A.ANSI CB.C+C.JAVAD.Python提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:A18.下面关于Charles使用说法错误的是()A.在数据包非常多的情况下,使用Charles的过滤功能来对数据包进行过滤从而减少干扰。B.通过单击图中方框框住的各个选项卡,可以非常直观地观察到请求和返回的各种信息。C.如果浏览器是Chrome,在没有安装第三方代理插件的情况下,Chrome的HTTP流量都会经过Charles。D.Charles无法支持计算机上除了浏

8、览器之外的其他软件。提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:D19.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.curlB.tar -zxvfC.mkdirD.cp提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:A20.Python中Object=1, 2, 3, 4, 5,则Objcet是()A.列表B.元组C.字典D.集合提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:A二、多选题 (共 10 道试题,共 20 分)21.下列关于mitmproxy的使用说法正确的是()A.mitmproxy的端口

9、为8080端口。B.设置好代理以后,在手机上打开一个App或者打开一个网页,可以看到mitmproxy上面有数据滚动。C.用鼠标在终端窗口上单击其中的任意一个请求,可以显示这个数据包的详情信息。D.如果要访问HTTPS网站,还需要安装mitmproxy的证书提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:ABCD22.cookies的缺点是A.实现自动登录B.跟踪用户状态C.http中明文传输D.增加http请求的流量提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:CD23.以下哪些可以独立成为Python编译器()A.PycharmB.IDLEC.

10、EclipseD.Visual Studio 2010提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:AB24.Python中()容器有推导式A.列表B.元组C.字典D.集合提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:ACD25.使用Selennium获取网页中元素的方法有A.find_element_by_nameB.find_element_by_idC.find_elements_by_nameD.find_elements_by_id提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:ABCD26.Python中一个函数

11、没有返回值则可以写()A.没有returnB.returnC.return NoneD.return NULL提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:ABC27.Python中一个函数可以有()个return语句A.0B.1C.多个D.2提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:ABCD28.以下哪些方法属于Python写CSV文件的方法()A.writeheadersB.writeheaderC.writerrowsD.writerow提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:ACD29.Python中通过

12、Key来从字典object中读取对应的Value的方法有()A.objectkeyB.object.get(key)C.object.pop(key)D.object.pop()提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:AB30.BS4可以用来从()中提取数据A.HTMLB.XMLC.数据库D.JSON提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:AB三、判断题 (共 20 道试题,共 40 分)31.scrapy与selenium结合可以实现直接处理需要异步加载的页面以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一

13、项,填写在答题卡上参考答案是:正确32.使用UI Automatorr让屏幕向右滚动的操作是得到相应控件后使用命令scroll.horiz.forward()以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误33.Python可以将列表或字典转换成Json字符串以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确34.Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据;以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上

14、参考答案是:正确35.cookies在http请求中是明文传输的。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确36.Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确37.在安装Scarpy的依赖库时,由于Visual C+ Build Tools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项

15、中选择一项,填写在答题卡上参考答案是:错误38.HTTP状态码503表示服务器内部故障。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误39.在有spiders何setting.py这两项的情况下,可以写出爬虫并且保存数据,items.py和pipelines.py文件是原作者的失误而导致的冗余文件。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误40.在Windows中下若要运行Redis可以运行redis-server /usr/local/etc/redis.conf以

16、上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误41.Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确42.安装mitmdump之前,运行sudo apt-get install python3-dev python3-pip libffi-dev libssl-dev是为了安装必要的运行环境。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确43.P

17、yMongoDB中排序方法sort第二个参数1表示降序以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误44.charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确45.为了保证数据插入效率,在内存允许的情况下,应该一次性把数据读入内存,尽量减少对MongoDB的读取操作。以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一

18、项,填写在答题卡上参考答案是:正确46.Redis的列表是一个单向队列以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误47.数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确48.如果把网络上发送与接收的数据包理解为快递包裹,那么在快递运输的过程中取出查看更改里面的内容,就是类似抓包的过程以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误49.MongoDB 是一个基于分布式文件存储的数据库,速度远快过Redis以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:错误50.对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888.以上叙述是否正确?A.正确B.错误提问:仔细分析上述试题,并从选项中选择一项,填写在答题卡上参考答案是:正确

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1