1、大数据采集与爬虫习题答案完整第一章一、判断题1、以下选项不属于程序设计语言类别的是 ( )A.机器语言B.汇编语言C.咼级语言D.解释语言2、 下列 Python 语句正确的是 ( )A、 min = x if x y ? x : yC、 if (x y) print xD、 while True : pass3、 以下不能创建一个字典的语句是 ( )A、 dict1 = B、 dict2 = 3 : 5 C、 dict3 = 1,2,3: “uestc”D、 dict4 = (1,2,3): “uestc ”二、判断题4、 模块文件的扩展名不一定是 .py。 ( )5、 字符和列表均支持成员
2、关系操作符(in)和长度计算函数(len()。() 答案: 1、 D 2、 D 3、 C 4、错 5、对第二章1、以下哪些是爬虫技术可能存在风险 ( )A、 大量占用爬去网站的资源B、 网站敏感信息的获取造成的不良后果C、 违背网站爬去设置D、 以上都是2、 下面表示一个文本类型的是( )A、 B、 C、 D、 3、 Tag 有很多方法和属性 ,下列哪个属性不是 Tag 中最重要的属性 ( )A、 nameB、 attributesC、 stringD、 type二、判断题4、 纵向爬虫主要面向大范围精确信息的爬取。 ( )5、 URL包含的信息指出文件的位置以及浏览器应该怎么处理它,所有互联
3、网上的每个文件都有一个唯一的 URL。 ( ) 答案: 1、 D 2、 B 3、 D 4、错 5、对第三章1、下列四项中,不属于数据库系统特点的是( )A、 数据共享B、 数据完整性C、 数据冗余度高D、 数据独立性高2、 数据库系统的数据独立性体现在 ( )A、 不会因为数据的变化而影响到应用程序B、 不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序C、 不会因为存储策略的变化而影响存储结构D、 不会因为某些存储结构的变化而影响其他的存储结构3、 .在数据结构中,从逻辑上可以把数据结构分成( )A、 动态结构和静态结构B、 紧凑结构和非紧凑结构C、 线性结构和非线性结构D、 内部结
4、构和外部结构二、判断题4、 数据存储反映的是系统中静止的数据,表现出静态数据的特征。 ( )5、 .每种数据结构都具备 3 个基本运算:插入、删除和查找。 ( ) 答案: 1、 C 2、 B 3、 C 4、对 5、错第四章1、对字符串的说法正确的是 ( )A、 字符串是基本数据类型B、 字符串值存储在栈内存中C、 字符串值初始化后可以被改变D、 字符串值一旦初始化就不会被改变2、 能切割字符串的方法是 ( )A、 indexOf( ) B、 substring( ) C、 split( ) D、 trim( )3、 I.String类中的getBytes()方法的作用是 ()A、 将整数变成字
5、符串B、 将字符串变成字符数组C、 将字符串变成字节数组D、 获取中字符串中字符的个数二、判断题4、 WEB API最主要的功能是实现构建基于 HTTP的面向各种客户端的服务框架()5、 GitHub 能够快速,高效地处理各种大小项目的版本控制和管理。 ( )答案:1、 D 2、 C 3、 C 4、对 5、对ATr-rr第五章1、ajax 中基本请求方式是什么 ( )A、get B、 post C、 request D、kill2、以下哪个技术不是 Ajax 技术体系的组成部分 ( )A、XMLHttpRequestB、DHTMLC、CSSD、DOM3、下列哪个工具不能用来调试浏览器中的 Ja
6、vaScript ( )A、MS Visual InterDevB、EclipseC、MS Script DebuggerD、 Mozilla Venkman二、判断题4、动态数据的准备和系统切换的时间没有直接关系。 ( )5、ajax 的 get 请求和 post 请求基本无区别。( ) 答案: 1、A 2、B 3、B 4、错 5、错第六章1、目前验证码的类型有 ( )A、 单击式验证码B、 图形验证码C、 滑动验证码D、 以上都是2、 以下关于加大验证码破解难度说法错误的是 ( )A.现在大部分主流网站的验证码都进行了扭曲、粘连、加干扰线等设计B.那些数字加字母的组合,特别是字母中还要区分
7、大小写的,字符集就会大很多C.使用中文字符D.字符中间加空格3、 在 Web 页面中增加验证码功能后,下面说法正确的是 ( )A、 可以增加账号破解等自动化软件的攻击难度B、 可以防止文件包含漏洞C、 可以防止缓冲溢出D、 可以i防止浏览二、判断题4、 验证码是一种用来区分计算机行为和人类行为的测试程序。 ( )5、 “参数说明”表示该API可以接收和发送的参数名称和类型。 () 答案:1、 D 2、 D 3、 A 4、对 5、对第七章1、Web 容器在收到浏览器请求时 ,会如何处理请求 ( )A、 使用单一执行绪处理所有请求B、 一个请求就建立一个执行绪来处理请求C、 一个请求就建立一个行程
8、来处理请求D、 一个请求就执行一个容器来处理请求2、 以下哪个选项不使用POST请求来发送 ()A、 使用者名称、密码B、 档案上传C、 搜寻引擎的结果画面D、 BLOG文件3、 【多选】GET请求和POST请求的区别有哪些 ()A、 安全B、 信息获取一致性C、 获取数据的长度一致D、 数据承载大小的不同二、判断题4、 在HTTP超文本传输协议中规定了四种与服务器进行交互的方式: GET, POST,PUT和 DELETE ()5、 Session是以数组的形式通过Sessionid进行检索的在服务器端存储的数据。答案: 1、 B 2、 C 3、 ABD 4、对 5、错第八章1、下列哪项不是
9、 Scrapy 的组件 ( )A、SelectorB、SpiderC、namenodeD、 Downloader Middleware2、HTML 的缩写是 ( )A、Hybrid Text Multipurpose LanguageB、High Texture Modular LanguageC、Hyper Text Markup LanguageD、 Hyper Text Middleware Language3、【多选】下列哪些是 Spider 中重要的属性 ( )A、loggerB、nameC、settingsD、 test二、判断题4、Scrapy 在某些请求失败或在处理它时发生错误,也可以继续运行其他请求()5、lxml 是一个基于 ElementTree 的 python API 的 XML 解析库。( ) 答案: 1、C 2、C 3、ABC 4、对 5、对
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1