南开大学21春学期《网络爬虫与信息提取》在线作业2.docx

上传人:b****4 文档编号:3094468 上传时间:2022-11-17 格式:DOCX 页数:10 大小:17.41KB
下载 相关 举报
南开大学21春学期《网络爬虫与信息提取》在线作业2.docx_第1页
第1页 / 共10页
南开大学21春学期《网络爬虫与信息提取》在线作业2.docx_第2页
第2页 / 共10页
南开大学21春学期《网络爬虫与信息提取》在线作业2.docx_第3页
第3页 / 共10页
南开大学21春学期《网络爬虫与信息提取》在线作业2.docx_第4页
第4页 / 共10页
南开大学21春学期《网络爬虫与信息提取》在线作业2.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

南开大学21春学期《网络爬虫与信息提取》在线作业2.docx

《南开大学21春学期《网络爬虫与信息提取》在线作业2.docx》由会员分享,可在线阅读,更多相关《南开大学21春学期《网络爬虫与信息提取》在线作业2.docx(10页珍藏版)》请在冰豆网上搜索。

南开大学21春学期《网络爬虫与信息提取》在线作业2.docx

南开大学21春学期《网络爬虫与信息提取》在线作业2

21春学期(1709、1803、1809、1903、1909、2003、2009、2103)《网络爬虫与信息提取》在线作业

Python正则表达式模块的findall方法返回结果为()

A:

列表

B:

元组

C:

字典

D:

集合

答案:

A

如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。

A:

字典

B:

集合的名字

C:

集合

D:

文档

答案:

C

使用UIAutomator获滚动屏幕的操作是得到相应控件后使用命令()

A:

scroll

B:

scroll_up

C:

scroll_forword

D:

scroll_back

答案:

A

下面Python代码输出为():

defdefault_para_without_trap(para=[],value=0):

ifnotpara:

para=[]

para.append(value)

returnpara

print('第一步:

{}'.format(default_para_trap(value=100)))

print('第二步:

{}'.format(default_para_trap(value=50)))

A:

第一步:

[100]

第二步:

[100,50]

B:

第一步:

[100]

第二步:

[50]

C:

第一步:

[100]

第二步:

[]

D:

第一步:

[100]

第二步:

[100]

答案:

B

MongoDB中可以将()数据结构插入集合中

A:

列表

B:

元组

C:

字典

D:

集合

答案:

C

Python中跳过本次循环应用关键字()

A:

break

B:

continue

C:

exit

D:

return

答案:

B

可以通过()绕过网站登录。



A:

session

B:

cookies

C:

moonpies

D:

localstorage

答案:

B

Python中把列表转换为集合需要使用##函数

A:

set

B:

list

C:

convert

D:

change

答案:

A

下列关于mitmproxy的安装说法错误的是()

A:

对于MacOS系统,使用Homebrew安装mitmproxy,命令为:

brewinstallmitmproxy

B:

在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本

C:

在windows系统中无法使用linux的命令,只能通过下载安装包来安装

D:

UBUNTU中执行命令sudopip3installmitmproxy进行安装

答案:

C

启动MongoDB使用命令mongod--()usr/local/etc/mongod.conf

A:

config

B:

install

C:

start

D:

begin

答案:

A

在Linux中哪个命令是添加权限的()

A:

chmod

B:

sudo

C:

cp

D:

mkdir

答案:

A

PyMongo中逻辑查询表示小于的符号是()

A:

$gt

B:

$lt

C:

$gte$$lte

答案:

B

Python中退出循环应用关键字()

A:

break

B:

continue

C:

exit

D:

return

答案:

A

HTTP常用状态码表明服务器正忙的是()

A:

500

B:

503

C:

403

D:

404

答案:

B

Redis中往集合中读数据,使用关键字()

A:

pop

B:

spop

C:

lpop

D:

range

答案:

B

Redis是一个开源的使用()语言编写

A:

ANSIC

B:

C++

C:

JAVA

D:

Python

答案:

A

使用xpath方法的返回类型是()

A:

列表

B:

元组

C:

字典

D:

集合

答案:

A

Python并导入uiautomator来操作设备的语句是fromuiautomatorimport()

A:

Device

B:

Devices

C:

Jobs

D:

Job

答案:

A

采用以下()技术可以实现异步加载

A:

HTML

B:

AJAX

C:

CSS

D:

HTTP

答案:

B

HTTP常用状态码表明服务器内部资源出故障了的是()

A:

500

B:

503

C:

403

D:

404

答案:

A

PyMongo删除操作有()

A:

delete

B:

delete_all

C:

delete_one

D:

delete_many

答案:

C,D

在配置ios使用Charles的操作中,正确的有()

A:

对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。

B:

选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888

C:

输入完成代理以后按下苹果设备的Home键,设置就会自动保存。

D:

安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任

答案:

A,B,C,D

常用的会话跟踪技术是

A:

session

B:

cookies

C:

moonpies

D:

localstorage

答案:

A,B

MongoDB中获取名字为db的库的语句为()

A:

client.db

B:

client('db')

C:

client['db']

D:

client{'db'}

答案:

A,C

如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()

A:

非法侵入计算机系统罪

B:

非法获取计算机信息系统数据罪

C:

非法获取计算机数据罪

D:

非法获取系统罪

答案:

A,B

如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司

A:

服务器日志

B:

数据库日志记录

C:

程序日志记录

D:

服务器监控

答案:

A,B,C,D

以下HTTP状态码表示服务器本身发生错误的是

A:

400

B:

503

C:

302

D:

500

答案:

B,D

使用BeautifulSoup对象后可以使用()来查找内容

A:

find_all

B:

find

C:

search

D:

search_all

答案:

A,B

Redis中的值可以支持()

A:

列表

B:

哈希

C:

集合

D:

有序集合

答案:

A,B,C,D

以下哪些方法属于Python写CSV文件的方法()

A:

writeheaders

B:

writeheader

C:

writerrows

D:

writerow

答案:

A,C,D

使用异步加载技术的网站,被加载的内容可以在源代码中找到

A:

B:

答案:

B

在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务

src/redis-server

A:

B:

答案:

B

通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。

A:

B:

答案:

A

process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用

A:

B:

答案:

B

chrome开发者工具没法对数据进行搜索。

如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.

A:

B:

答案:

A

XPath提取出来的内容是一个SelectorList对象,它的第0个元素就是网页的源代码。

A:

B:

答案:

B

在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。

A:

B:

答案:

B

自己能查看的数据,允许擅自拿给第三方查看

A:

B:

答案:

B

引用中间件时后面的数字代表的是中间件的执行顺序,例如'AdvanceSpider.middlewares.ProxyMiddleware':

543中的543

A:

B:

答案:

A

虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。

A:

B:

答案:

A

Python可以将列表或字典转换成Json字符串

A:

B:

答案:

A

Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取

A:

B:

答案:

B

Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。

30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次

A:

B:

答案:

A

Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库

A:

B:

答案:

A

Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本

A:

B:

答案:

A

所有的异步加载都会向后台发送请求

A:

B:

答案:

B

HTTP状态码302表示资源永久重定向。

A:

B:

答案:

B

RoboMongo是MongoDB的管理软件

A:

B:

答案:

A

cookies在http请求中是明文传输的。

A:

B:

答案:

A

在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线

A:

B:

答案:

B

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 水产渔业

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1