21秋学期南开大学《网络爬虫与信息提取》在线作业.docx

上传人:b****1 文档编号:749110 上传时间:2022-10-12 格式:DOCX 页数:11 大小:18.47KB
下载 相关 举报
21秋学期南开大学《网络爬虫与信息提取》在线作业.docx_第1页
第1页 / 共11页
21秋学期南开大学《网络爬虫与信息提取》在线作业.docx_第2页
第2页 / 共11页
21秋学期南开大学《网络爬虫与信息提取》在线作业.docx_第3页
第3页 / 共11页
21秋学期南开大学《网络爬虫与信息提取》在线作业.docx_第4页
第4页 / 共11页
21秋学期南开大学《网络爬虫与信息提取》在线作业.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

21秋学期南开大学《网络爬虫与信息提取》在线作业.docx

《21秋学期南开大学《网络爬虫与信息提取》在线作业.docx》由会员分享,可在线阅读,更多相关《21秋学期南开大学《网络爬虫与信息提取》在线作业.docx(11页珍藏版)》请在冰豆网上搜索。

21秋学期南开大学《网络爬虫与信息提取》在线作业.docx

21秋学期南开大学网络爬虫与信息提取在线作业秋学期南开大学网络爬虫与信息提取在线作业21秋学期(1709、1803、1809、1903、1909、2003、2009、2103)网络爬虫与信息提取在线作业1:

Python中线程池map()方法第二个参数是()A、列表B、元组C、字典D、集合答案:

A2:

通过()爬取伪装成异步加载的后端渲染数据A、正则表达式B、Json字符串C、JavaScriptD、Get答案:

A3:

下面Python代码输出为():

defdefault_para_without_trap(para=,value=0):

ifnotpara:

para=para.append(value)returnparaprint(第一步:

.format(default_para_trap(value=100)print(第二步:

.format(default_para_trap(value=50)A、第一步:

100第二步:

100,50B、第一步:

100第二步:

50C、第一步:

100第二步:

D、第一步:

100第二步:

100答案:

B4:

Python中若定义object=(1,2,3,4,5),则print(object1:

3)输出()A、12B、123C、23D、234答案:

C5:

在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?

()A、spiders文件夹B、item.pyC、pipeline.pyD、settings.py答案:

C6:

浏览器用来记录用户状态信息的数据叫A、sessionB、cookiesC、moonpiesD、selenium答案:

B7:

PyMongo中查询所有age29的记录是()A、collection.find(age:

$gt:

29)B、collection.find(age29)C、collection.find_all(age:

$gt:

29)D、collection.find_all(age29)答案:

A8:

Redis中往集合中添加数据,使用关键字()A、saddB、addC、appendD、sappend答案:

A9:

Redis中如果不删除列表中的数据,又要把数据读出来,就需要使用关键字()A、rangeB、lrangeC、srangeD、pop答案:

B10:

在Python中,为了使用XPath,需要安装一个第三方库()A、lxmlB、xmlC、xpathD、path答案:

A11:

Python操作CSV文件可通过()容器的方式操作单元格A、列表B、元组C、字典D、集合答案:

C12:

某些网站在发起Ajax请求时会携带()字符串用于身份验证A、TokenB、CookieC、ReqTimeD、sum答案:

A13:

PyMongo中逻辑查询表示不等于的符号是()A、$gtB、$ltC、$eqD、$ne答案:

C14:

下列说法错误的是()A、Charles只能截获HTTP和HTTPS的数据包,如果网站使用的是websocket或者是flashsocket,那么Charles就无能为力。

B、有一些App会自带证书,使用其他证书都无法正常访问后台接口。

在这种情况下,Charles自带的证书就不能正常使用,也就没有办法抓取这种App的数据C、有一些App的数据经过加密,App接收到数据以后在其内部进行解密。

Charles无法获取这种App的数据D、对于上述情况,Charles能抓取到经过加密的数据。

但是如果无法知道数据的具体加密方法,就没有办法解读Charles抓取到的数据。

答案:

C15:

使用Xpath获取文本使用()A、textB、text()C、contentD、content()答案:

B16:

启动MongoDB使用命令mongod-()usr/local/etc/mongod.confA、configB、installC、startD、begin答案:

A17:

Redis中查看一个列表长度,使用关键字()A、lenB、lengthC、llenD、count答案:

C18:

Python中若定义object=12345,则print(object:

-1)输出()A、1B、5C、54321D、程序报错答案:

C19:

在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?

()A、spiders文件夹B、item.pyC、pipeline.pyD、settings.py答案:

D20:

当爬虫运行到yieldscrapy.Request()或者yielditem的时候,下列哪个爬虫中间件的方法被调用?

A、process_spider_output()B、process_spider_exception()C、process_spider_input()D、process_start_requests()答案:

A21:

在配置ios使用Charles的操作中,正确的有()A、对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。

B、选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888C、输入完成代理以后按下苹果设备的Home键,设置就会自动保存。

D、安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任答案:

A,B,C,D22:

下载器中间件的作用有哪些?

A、更换代理IPB、更换CookiesC、更换User-AgentD、自动重试答案:

A,B,C,D23:

下列关于在IOS上配置charles的说法正确的是()A、不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。

B、手机和电脑需要在同一个局域网下。

C、HTTP代理可以使用“自动”选项。

D、安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动答案:

B,D24:

如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()A、非法侵入计算机系统罪B、非法获取计算机信息系统数据罪C、非法获取计算机数据罪D、非法获取系统罪答案:

A,B25:

Python中一个函数没有返回值则可以写()A、没有returnB、returnC、returnNoneD、returnNULL答案:

A,B,C26:

使用BeautifulSoup对象后可以使用()来查找内容A、find_allB、findC、searchD、search_all答案:

A,B27:

PyMongo删除操作有()A、deleteB、delete_allC、delete_oneD、delete_many答案:

C,D28:

以下哪些方法属于Python写CSV文件的方法()A、writeheadersB、writeheaderC、writerrowsD、writerow答案:

A,C,D29:

MongoDB中获取名字为db的库的语句为()A、client.dbB、client(db)C、clientdbD、clientdb答案:

A,C30:

Python中()容器有推导式A、列表B、元组C、字典D、集合答案:

A,C,D31:

中间人攻击也是抓包的一种。

T、对F、错答案:

F32:

在请求头中设置User-Agent即可正常请求网站T、对F、错答案:

F33:

UIAutomatorViewer与Pythonuiautomator可以同时使用T、对F、错答案:

F34:

device.sleep()方法是使用UIAutomatorr关闭屏幕的命令T、对F、错答案:

T35:

爬虫的源代码通过公开不会对被爬虫网站造成影响T、对F、错答案:

F36:

虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。

T、对F、错答案:

T37:

打码平台都是靠机器使用OCR技术识别图片上的文字。

T、对F、错答案:

F38:

Python中包含字典的列表页可以转换成JSON字符串T、对F、错答案:

T39:

需要实名认证的打码网站更加安全可靠。

T、对F、错答案:

F40:

MongoDBURI的格式为:

mongodb:

/服务器IP或域名:

端口用户名:

密码T、对F、错答案:

F41:

MongoDB中ObjectId可以反向恢复为时间T、对F、错答案:

T42:

验证码必须通过手动填充识别。

T、对F、错答案:

F43:

使用UIAutomatorr操作实体键的命令为device.press.实体按键名称()T、对F、错答案:

T44:

在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务src/redis-serverT、对F、错答案:

F45:

开源库pytesseract的作用是将图像中文字转换为文本。

T、对F、错答案:

T46:

Redis的集合与Python的集合一样,没有顺序,值不重复T、对F、错答案:

T47:

mitmproxy的强大之处在于它还自带一个mitmdump命令。

这个命令可以用来运行符合一定规则的Python脚本T、对F、错答案:

T48:

process_spider_input(response,spider)是在爬虫运行yielditem或者yieldscrapy.Request()的时候调用T、对F、错答案:

F49:

上课传纸条。

A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。

此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。

T、对F、错答案:

F50:

在安装Scarpy的依赖库时,由于VisualC+BuildTools的安装速度很慢,为了节省时间,可以和安装Twisted同时进行T、对F、错答案:

F

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1