南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx
《南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx》由会员分享,可在线阅读,更多相关《南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案.docx(13页珍藏版)》请在冰豆网上搜索。
南开21春学期《网络爬虫与信息提取》在线作业辅导材料附答案
南开21春学期(1709-2103)《网络爬虫与信息提取》在线作业
提示:
南开大学课程学习已经开启,本套试卷是课程学习辅导资料,只作参考学习使用!
!
!
一、单选题(共20道试题,共40分)
1.Python正则表达式模块的findall方法返回结果为()
[A.]列表
[B.]元组
[C.]字典
[D.]集合
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
2.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。
[A.]字典
[B.]集合的名字
[C.]集合
[D.]文档
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
C
3.使用UIAutomator获滚动屏幕的操作是得到相应控件后使用命令()
[A.]scroll
[B.]scroll_up
[C.]scroll_forword
[D.]scroll_back
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
4.下面Python代码输出为():
defdefault_para_without_trap(para=[],value=0):
ifnotpara:
para=[]par[A.]append(value)returnparaprint('第一步:
{}'.format(default_para_trap(value=100)))print('第二步:
{}'.format(default_para_trap(value=50)))
[A.]第一步:
[100]第二步:
[100,50]
[B.]第一步:
[100]第二步:
[50]
[C.]第一步:
[100]第二步:
[]
[D.]第一步:
[100]第二步:
[100]
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
5.MongoDB中可以将()数据结构插入集合中
[A.]列表
[B.]元组
[C.]字典
[D.]集合
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
C
6.Python中跳过本次循环应用关键字()
[A.]break
[B.]continue
[C.]exit
[D.]return
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
7.可以通过()绕过网站登录。
[A.]session
[B.]cookies
[C.]moonpies
[D.]localstorage
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
8.Python中把列表转换为集合需要使用##函数
[A.]set
[B.]list
[C.]convert
[D.]change
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
9.下列关于mitmproxy的安装说法错误的是()
[A.]对于MacOS系统,使用Homebrew安装mitmproxy,命令为:
brewinstallmitmproxy
[B.]在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本
[C.]在windows系统中无法使用linux的命令,只能通过下载安装包来安装
[D.]UBUNTU中执行命令sudopip3installmitmproxy进行安装
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
C
10.启动MongoDB使用命令mongod--()usr/local/etc/mongo[D.]conf
[A.]config
[B.]install
[C.]start
[D.]begin
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
11.在Linux中哪个命令是添加权限的()
[A.]chmod
[B.]sudo
[C.]cp
[D.]mkdir
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
12.PyMongo中逻辑查询表示小于的符号是()
[A.]$gt
[B.]$lt
[C.]$gte$$lte
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
13.Python中退出循环应用关键字()
[A.]break
[B.]continue
[C.]exit
[D.]return
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
14.HTTP常用状态码表明服务器正忙的是()
[A.]500
[B.]503
[C.]403
[D.]404
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
15.Redis中往集合中读数据,使用关键字()
[A.]pop
[B.]spop
[C.]lpop
[D.]range
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
16.Redis是一个开源的使用()语言编写
[A.]ANSIC
[B.]C++
[C.]JAVA
[D.]Python
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
17.使用xpath方法的返回类型是()
[A.]列表
[B.]元组
[C.]字典
[D.]集合
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
18.Python并导入uiautomator来操作设备的语句是fromuiautomatorimport()
[A.]Device
[B.]Devices
[C.]Jobs
[D.]Job
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
19.采用以下()技术可以实现异步加载
[A.]HTML
[B.]AJAX
[C.]CSS
[D.]HTTP
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
B
20.HTTP常用状态码表明服务器内部资源出故障了的是()
[A.]500
[B.]503
[C.]403
[D.]404
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
A
二、多选题(共10道试题,共20分)
21.PyMongo删除操作有()
[A.]delete
[B.]delete_all
[C.]delete_one
[D.]delete_many
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
CD
22.在配置ios使用Charles的操作中,正确的有()
[A.]对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
[B.]选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
[C.]输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
[D.]安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
ABCD
23.常用的会话跟踪技术是
[A.]session
[B.]cookies
[C.]moonpies
[D.]localstorage
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
AB
24.MongoDB中获取名字为db的库的语句为()
[A.]client.db
[B.]client('db')
[C.]client['db']
[D.]client{'db'}
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
AC
25.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
[A.]非法侵入计算机系统罪
[B.]非法获取计算机信息系统数据罪
[C.]非法获取计算机数据罪
[D.]非法获取系统罪
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
AB
26.如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司
[A.]服务器日志
[B.]数据库日志记录
[C.]程序日志记录
[D.]服务器监控
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
ABCD
27.以下HTTP状态码表示服务器本身发生错误的是
[A.]400
[B.]503
[C.]302
[D.]500
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
BD
28.使用BeautifulSoup对象后可以使用()来查找内容
[A.]find_all
[B.]find
[C.]search
[D.]search_all
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
AB
29.Redis中的值可以支持()
[A.]列表
[B.]哈希
[C.]集合
[D.]有序集合
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
ABCD
30.以下哪些方法属于Python写CSV文件的方法()
[A.]writeheaders
[B.]writeheader
[C.]writerrows
[D.]writerow
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
ACD
三、判断题(共20道试题,共40分)
31.使用异步加载技术的网站,被加载的内容可以在源代码中找到
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
32.在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务src/redis-server
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
33.通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
34.process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
35.chrome开发者工具没法对数据进行搜索。
如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
36.XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
37.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
38.自己能查看的数据,允许擅自拿给第三方查看
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
39.引用中间件时后面的数字代表的是中间件的执行顺序,例如'AdvanceSpider.middlewares.ProxyMiddleware':
543中的543
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
40.虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
41.Python可以将列表或字典转换成Json字符串
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
42.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
43.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。
30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
44.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
45.Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
46.所有的异步加载都会向后台发送请求
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
47.HTTP状态码302表示资源永久重定向。
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误
48.RoboMongo是MongoDB的管理软件
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
49.cookies在http请求中是明文传输的。
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
正确
50.在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线
[以上叙述是否正确?
]
[A.]正确
[B.]错误
[提问:
仔细分析上述试题,并从选项中选择一项,填写在答题卡上]
参考答案是:
错误