南开21春学期《网络爬虫与信息提取》在线作业5.docx
《南开21春学期《网络爬虫与信息提取》在线作业5.docx》由会员分享,可在线阅读,更多相关《南开21春学期《网络爬虫与信息提取》在线作业5.docx(11页珍藏版)》请在冰豆网上搜索。
![南开21春学期《网络爬虫与信息提取》在线作业5.docx](https://file1.bdocx.com/fileroot1/2022-12/6/f4d32a7c-9d15-48fc-8175-21c5d21f3c7d/f4d32a7c-9d15-48fc-8175-21c5d21f3c7d1.gif)
南开21春学期《网络爬虫与信息提取》在线作业5
奥鹏南开作业21春学期(1709、1803、1809、1903、1909、2021、2021、2103)《网络爬虫与信息提取》在线作业
Python正则表达式模块的findall方法返回结果为()
选项A:
列表
选项B:
元组
选项C:
字典
选项D:
集合
正确选项:
A
如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。
选项A:
字典
选项B:
集合的名字
选项C:
集合
选项D:
文档
正确选项:
C
使用UIAutomator获滚动屏幕的操作是得到相应控件后使用命令()
选项A:
scroll
选项B:
scroll_up
选项C:
scroll_forword
选项D:
scroll_back
正确选项:
A
下面Python代码输出为():
defdefault_para_without_trap(para=[],value=0):
ifnotpara:
para=[]
para.append(value)
returnpara
print('第一步:
{}'.format(default_para_trap(value=100)))
print('第二步:
{}'.format(default_para_trap(value=50)))
选项A:
第一步:
[100]
第二步:
[100,50]
选项B:
第一步:
[100]
第二步:
[50]
选项C:
第一步:
[100]
第二步:
[]
选项D:
第一步:
[100]
第二步:
[100]
正确选项:
B
MongoDB中可以将()数据结构插入集合中
选项A:
列表
选项B:
元组
选项C:
字典
选项D:
集合
正确选项:
C
Python中跳过本次循环应用关键字()
选项A:
break
选项B:
continue
选项C:
exit
选项D:
return
正确选项:
B
可以通过()绕过网站登录。
选项A:
session
选项B:
cookies
选项C:
moonpies
选项D:
localstorage
正确选项:
B
Python中把列表转换为集合需要使用##函数
选项A:
set
选项B:
list
选项C:
convert
选项D:
change
正确选项:
A
下列关于mitmproxy的安装说法错误的是()
选项A:
对于MacOS系统,使用Homebrew安装mitmproxy,命令为:
brewinstallmitmproxy
选项B:
在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本
选项C:
在windows系统中无法使用linux的命令,只能通过下载安装包来安装
选项D:
UBUNTU中执行命令sudopip3installmitmproxy进行安装
正确选项:
C
启动MongoDB使用命令mongod--()usr/local/etc/mongod.conf
选项A:
config
选项B:
install
选项C:
start
选项D:
begin
正确选项:
A
在Linux中哪个命令是添加权限的()
选项A:
chmod
选项B:
sudo
选项C:
cp
选项D:
mkdir
正确选项:
A
PyMongo中逻辑查询表示小于的符号是()
选项A:
$gt
选项B:
$lt
选项C:
$gte$$lte
正确选项:
B
Python中退出循环应用关键字()
选项A:
break
选项B:
continue
选项C:
exit
选项D:
return
正确选项:
A
HTTP常用状态码表明服务器正忙的是()
选项A:
500
选项B:
503
选项C:
403
选项D:
404
正确选项:
B
Redis中往集合中读数据,使用关键字()
选项A:
pop
选项B:
spop
选项C:
lpop
选项D:
range
正确选项:
B
Redis是一个开源的使用()语言编写
选项A:
ANSIC
选项B:
C++
选项C:
JAVA
选项D:
Python
正确选项:
A
使用xpath方法的返回类型是()
选项A:
列表
选项B:
元组
选项C:
字典
选项D:
集合
正确选项:
A
Python并导入uiautomator来操作设备的语句是fromuiautomatorimport()
选项A:
Device
选项B:
Devices
选项C:
Jobs
选项D:
Job
正确选项:
A
采用以下()技术可以实现异步加载
选项A:
HTML
选项B:
AJAX
选项C:
CSS
选项D:
HTTP
正确选项:
B
HTTP常用状态码表明服务器内部资源出故障了的是()
选项A:
500
选项B:
503
选项C:
403
选项D:
404
正确选项:
A
PyMongo删除操作有()
选项A:
delete
选项B:
delete_all
选项C:
delete_one
选项D:
delete_many
正确选项:
C,D
在配置ios使用Charles的操作中,正确的有()
选项A:
对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
选项B:
选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
选项C:
输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
选项D:
安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
正确选项:
A,B,C,D
常用的会话跟踪技术是
选项A:
session
选项B:
cookies
选项C:
moonpies
选项D:
localstorage
正确选项:
A,B
MongoDB中获取名字为db的库的语句为()
选项A:
client.db
选项B:
client('db')
选项C:
client['db']
选项D:
client{'db'}
正确选项:
A,C
如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
选项A:
非法侵入计算机系统罪
选项B:
非法获取计算机信息系统数据罪
选项C:
非法获取计算机数据罪
选项D:
非法获取系统罪
正确选项:
A,B
如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司
选项A:
服务器日志
选项B:
数据库日志记录
选项C:
程序日志记录
选项D:
服务器监控
正确选项:
A,B,C,D
以下HTTP状态码表示服务器本身发生错误的是
选项A:
400
选项B:
503
选项C:
302
选项D:
500
正确选项:
B,D
使用BeautifulSoup对象后可以使用()来查找内容
选项A:
find_all
选项B:
find
选项C:
search
选项D:
search_all
正确选项:
A,B
Redis中的值可以支持()
选项A:
列表
选项B:
哈希
选项C:
集合
选项D:
有序集合
正确选项:
A,B,C,D
以下哪些方法属于Python写CSV文件的方法()
选项A:
writeheaders
选项B:
writeheader
选项C:
writerrows
选项D:
writerow
正确选项:
A,C,D
使用异步加载技术的网站,被加载的内容可以在源代码中找到
选项A:
对
选项B:
错
正确选项:
B
在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务
src/redis-server
选项A:
对
选项B:
错
正确选项:
B
通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
选项A:
对
选项B:
错
正确选项:
A
process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用
选项A:
对
选项B:
错
正确选项:
B
chrome开发者工具没法对数据进行搜索。
如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
选项A:
对
选项B:
错
正确选项:
A
XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。
选项A:
对
选项B:
错
正确选项:
B
在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
选项A:
对
选项B:
错
正确选项:
B
自己能查看的数据,允许擅自拿给第三方查看
选项A:
对
选项B:
错
正确选项:
B
引用中间件时后面的数字代表的是中间件的执行顺序,例如'AdvanceSpider.middlewares.ProxyMiddleware':
543中的543
选项A:
对
选项B:
错
正确选项:
A
虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
选项A:
对
选项B:
错
正确选项:
A
Python可以将列表或字典转换成Json字符串
选项A:
对
选项B:
错
正确选项:
A
Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
选项A:
对
选项B:
错
正确选项:
B
Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。
30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
选项A:
对
选项B:
错
正确选项:
A
Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
选项A:
对
选项B:
错
正确选项:
A
Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本
选项A:
对
选项B:
错
正确选项:
A
所有的异步加载都会向后台发送请求
选项A:
对
选项B:
错
正确选项:
B
HTTP状态码302表示资源永久重定向。
选项A:
对
选项B:
错
正确选项:
B
RoboMongo是MongoDB的管理软件
选项A:
对
选项B:
错
正确选项:
A
cookies在http请求中是明文传输的。
选项A:
对
选项B:
错
正确选项:
A
在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线
选项A:
对
选项B:
错
正确选项:
B