南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx

上传人:b****5 文档编号:3416576 上传时间:2022-11-22 格式:DOCX 页数:13 大小:18.08KB
下载 相关 举报
南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx_第1页
第1页 / 共13页
南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx_第2页
第2页 / 共13页
南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx_第3页
第3页 / 共13页
南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx_第4页
第4页 / 共13页
南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx

《南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx》由会员分享,可在线阅读,更多相关《南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx(13页珍藏版)》请在冰豆网上搜索。

南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx

南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案

南开21春学期(1709-2103)《网络爬虫与信息提取》在线作业

提示:

南开大学课程学习已经开启,本套试卷是课程学习辅导资料,只作参考学习使用!

一、单选题(共20道试题,共40分)

1.Python正则表达式模块的findall方法返回结果为()

[A.]列表

[B.]元组

[C.]字典

[D.]集合

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

2.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。

[A.]字典

[B.]集合的名字

[C.]集合

[D.]文档

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

C

3.使用UIAutomator获滚动屏幕的操作是得到相应控件后使用命令()

[A.]scroll

[B.]scroll_up

[C.]scroll_forword

[D.]scroll_back

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

4.下面Python代码输出为():

defdefault_para_without_trap(para=[],value=0):

ifnotpara:

para=[]par[A.]append(value)returnparaprint('第一步:

{}'.format(default_para_trap(value=100)))print('第二步:

{}'.format(default_para_trap(value=50)))

[A.]第一步:

[100]第二步:

[100,50]

[B.]第一步:

[100]第二步:

[50]

[C.]第一步:

[100]第二步:

[]

[D.]第一步:

[100]第二步:

[100]

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

5.MongoDB中可以将()数据结构插入集合中

[A.]列表

[B.]元组

[C.]字典

[D.]集合

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

C

6.Python中跳过本次循环应用关键字()

[A.]break

[B.]continue

[C.]exit

[D.]return

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

7.可以通过()绕过网站登录。

[A.]session

[B.]cookies

[C.]moonpies

[D.]localstorage

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

8.Python中把列表转换为集合需要使用##函数

[A.]set

[B.]list

[C.]convert

[D.]change

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

9.下列关于mitmproxy的安装说法错误的是()

[A.]对于MacOS系统,使用Homebrew安装mitmproxy,命令为:

brewinstallmitmproxy

[B.]在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本

[C.]在windows系统中无法使用linux的命令,只能通过下载安装包来安装

[D.]UBUNTU中执行命令sudopip3installmitmproxy进行安装

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

C

10.启动MongoDB使用命令mongod--()usr/local/etc/mongo[D.]conf

[A.]config

[B.]install

[C.]start

[D.]begin

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

11.在Linux中哪个命令是添加权限的()

[A.]chmod

[B.]sudo

[C.]cp

[D.]mkdir

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

12.PyMongo中逻辑查询表示小于的符号是()

[A.]$gt

[B.]$lt

[C.]$gte$$lte

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

13.Python中退出循环应用关键字()

[A.]break

[B.]continue

[C.]exit

[D.]return

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

14.HTTP常用状态码表明服务器正忙的是()

[A.]500

[B.]503

[C.]403

[D.]404

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

15.Redis中往集合中读数据,使用关键字()

[A.]pop

[B.]spop

[C.]lpop

[D.]range

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

16.Redis是一个开源的使用()语言编写

[A.]ANSIC

[B.]C++

[C.]JAVA

[D.]Python

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

17.使用xpath方法的返回类型是()

[A.]列表

[B.]元组

[C.]字典

[D.]集合

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

18.Python并导入uiautomator来操作设备的语句是fromuiautomatorimport()

[A.]Device

[B.]Devices

[C.]Jobs

[D.]Job

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

19.采用以下()技术可以实现异步加载

[A.]HTML

[B.]AJAX

[C.]CSS

[D.]HTTP

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

B

20.HTTP常用状态码表明服务器内部资源出故障了的是()

[A.]500

[B.]503

[C.]403

[D.]404

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

A

二、多选题(共10道试题,共20分)

21.PyMongo删除操作有()

[A.]delete

[B.]delete_all

[C.]delete_one

[D.]delete_many

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

CD

22.在配置ios使用Charles的操作中,正确的有()

[A.]对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。

[B.]选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888

[C.]输入完成代理以后按下苹果设备的Home键,设置就会自动保存。

[D.]安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

ABCD

23.常用的会话跟踪技术是

[A.]session

[B.]cookies

[C.]moonpies

[D.]localstorage

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

AB

24.MongoDB中获取名字为db的库的语句为()

[A.]client.db

[B.]client('db')

[C.]client['db']

[D.]client{'db'}

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

AC

25.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()

[A.]非法侵入计算机系统罪

[B.]非法获取计算机信息系统数据罪

[C.]非法获取计算机数据罪

[D.]非法获取系统罪

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

AB

26.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司

[A.]服务器日志

[B.]数据库日志记录

[C.]程序日志记录

[D.]服务器监控

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

ABCD

27.以下HTTP状态码表示服务器本身发生错误的是

[A.]400

[B.]503

[C.]302

[D.]500

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

BD

28.使用BeautifulSoup对象后可以使用()来查找内容

[A.]find_all

[B.]find

[C.]search

[D.]search_all

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

AB

29.Redis中的值可以支持()

[A.]列表

[B.]哈希

[C.]集合

[D.]有序集合

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

ABCD

30.以下哪些方法属于Python写CSV文件的方法()

[A.]writeheaders

[B.]writeheader

[C.]writerrows

[D.]writerow

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

ACD

三、判断题(共20道试题,共40分)

31.使用异步加载技术的网站,被加载的内容可以在源代码中找到

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

32.在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务src/redis-server

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

33.通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

34.process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

35.chrome开发者工具没法对数据进行搜索。

如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

36.XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

37.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

38.自己能查看的数据,允许擅自拿给第三方查看

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

39.引用中间件时后面的数字代表的是中间件的执行顺序,例如'AdvanceSpider.middlewares.ProxyMiddleware':

543中的543

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

40.虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

41.Python可以将列表或字典转换成Json字符串

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

42.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

43.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。

30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

44.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

45.Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

46.所有的异步加载都会向后台发送请求

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

47.HTTP状态码302表示资源永久重定向。

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

48.RoboMongo是MongoDB的管理软件

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

49.cookies在http请求中是明文传输的。

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

正确

50.在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线

[以上叙述是否正确?

]

[A.]正确

[B.]错误

[提问:

仔细分析上述试题,并从选项中选择一项,填写在答题卡上]

参考答案是:

错误

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 教育学心理学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1