大数据采集与爬虫习题答案完整.docx
《大数据采集与爬虫习题答案完整.docx》由会员分享,可在线阅读,更多相关《大数据采集与爬虫习题答案完整.docx(7页珍藏版)》请在冰豆网上搜索。
大数据采集与爬虫习题答案完整
第一章
一、判断题
1、以下选项不属于程序设计语言类别的是()
A..机器语言
B..汇编语言
C..咼级语言
D..解释语言
2、下列Python语句正确的是()
A、min=xifxB、max=x>y?
x:
y
C、if(x>y)printx
D、whileTrue:
pass
3、以下不能创建一个字典的语句是()
A、dict1={}
B、dict2={3:
5}
C、dict3={[1,2,3]:
“uestc”}
D、dict4={(1,2,3):
“uestc”}
二、判断题
4、模块文件的扩展名不一定是.py。
()
5、字符和列表均支持成员关系操作符(in)和长度计算函数(len())。
()答案:
1、D2、D3、C4、错5、对
第二章
1、以下哪些是爬虫技术可能存在风险()
A、大量占用爬去网站的资源
B、网站敏感信息的获取造成的不良后果
C、违背网站爬去设置
D、以上都是
2、下面表示一个文本类型的是()
A、
B、
C、
D、
3、Tag有很多方法和属性,下列哪个属性不是Tag中最重要的属性()
A、name
B、attributes
C、string
D、type
二、判断题
4、纵向爬虫主要面向大范围精确信息的爬取。
()
5、URL包含的信息指出文件的位置以及浏览器应该怎么处理它,所
有互联网上的每个文件都有一个唯一的URL。
()答案:
1、D2、B3、D4、错5、对
第三章
1、下列四项中,不属于数据库系统特点的是()
A、数据共享
B、数据完整性
C、数据冗余度高
D、数据独立性高
2、数据库系统的数据独立性体现在()
A、不会因为数据的变化而影响到应用程序
B、不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序
C、不会因为存储策略的变化而影响存储结构
D、不会因为某些存储结构的变化而影响其他的存储结构
3、.在数据结构中,从逻辑上可以把数据结构分成()
A、动态结构和静态结构
B、紧凑结构和非紧凑结构
C、线性结构和非线性结构
D、内部结构和外部结构
二、判断题
4、数据存储反映的是系统中静止的数据,表现出静态数据的特征。
()
5、.每种数据结构都具备3个基本运算:
插入、删除和查找。
()答案:
1、C2、B3、C4、对5、错
第四章
1、对字符串的说法正确的是()
A、字符串是基本数据类型
B、字符串值存储在栈内存中
C、字符串值初始化后可以被改变
D、字符串值一旦初始化就不会被改变
2、能切割字符串的方法是()
A、indexOf()B、substring()C、split()D、trim()
3、I.String类中的getBytes()方法的作用是()
A、将整数变成字符串
B、将字符串变成字符数组
C、将字符串变成字节数组
D、获取中字符串中字符的个数
二、判断题
4、WEBAPI最主要的功能是实现构建基于HTTP的面向各种客户端的服务框架
()
5、GitHub能够快速,高效地处理各种大小项目的版本控制和管理。
()
答案:
1、D2、C3、C4、对5、对
ATr-rr
第五章
1、ajax中基本请求方式是什么()
A、getB、postC、requestD、kill
2、以下哪个技术不是Ajax技术体系的组成部分()
A、XMLHttpRequest
B、DHTML
C、CSS
D、DOM
3、下列哪个工具不能用来调试浏览器中的JavaScript()
A、MSVisualInterDev
B、Eclipse
C、MSScriptDebugger
D、MozillaVenkman
二、判断题
4、动态数据的准备和系统切换的时间没有直接关系。
()
5、ajax的get请求和post请求基本无区别。
()答案:
1、A2、B3、B4、错5、错
第六章
1、目前验证码的类型有()
A、单击式验证码
B、图形验证码
C、滑动验证码
D、以上都是
2、以下关于加大验证码破解难度说法错误的是()
A.现在大部分主流网站的验证码都进行了扭曲、粘连、加干扰线等设计
B.那些数字加字母的组合,特别是字母中还要区分大小写的,字符集就会大很多
C.使用中文字符
D.字符中间加空格
3、在Web页面中增加验证码功能后,下面说法正确的是()
A、可以增加账号破解等自动化软件的攻击难度
B、可以防止文件包含漏洞
C、可以防止缓冲溢出
D、可以i防止浏览
二、判断题
4、验证码是一种用来区分计算机行为和人类行为的测试程序。
()
5、“参数说明”表示该API可以接收和发送的参数名称和类型。
()答案:
1、D2、D3、A4、对5、对
第七章
1、Web容器在收到浏览器请求时,会如何处理请求()
A、使用单一执行绪处理所有请求
B、一个请求就建立一个执行绪来处理请求
C、一个请求就建立一个行程来处理请求
D、一个请求就执行一个容器来处理请求
2、以下哪个选项不使用POST请求来发送()
A、使用者名称、密码
B、档案上传
C、搜寻引擎的结果画面
D、BLOG文件
3、【多选】GET请求和POST请求的区别有哪些()
A、安全
B、信息获取一致性
C、获取数据的长度一致
D、数据承载大小的不同
二、判断题
4、在HTTP超文本传输协议中规定了四种与服务器进行交互的方式:
GET,POST,
PUT和DELETE()
5、Session是以数组的形式通过Sessionid进行检索的在服务器端存储的数据。
答案:
1、B2、C3、ABD4、对5、错
第八章
1、下列哪项不是Scrapy的组件()
A、Selector
B、Spider
C、namenode
D、DownloaderMiddleware
2、HTML的缩写是()
A、HybridTextMultipurposeLanguage
B、HighTextureModularLanguage
C、HyperTextMarkupLanguage
D、HyperTextMiddlewareLanguage
3、【多选】下列哪些是Spider中重要的属性()
A、logger
B、name
C、settings
D、test
二、判断题
4、Scrapy在某些请求失败或在处理它时发生错误,也可以继续运行其他请求
()
5、lxml是一个基于ElementTree的pythonAPI的XML解析库。
()答案:
1、C2、C3、ABC4、对5、对