ImageVerifierCode 换一换
格式:DOCX , 页数:25 ,大小:38.69KB ,
资源ID:8642158      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8642158.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(数据分析师题库及答案.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

数据分析师题库及答案.docx

1、数据分析师题库及答案2022年数据分析师题库及答案1. 在软件开发过程中,我们可以采用不同的过程模型,下列有关 增量模型描述正确的是()A. 是一种线性开发模型,具有不可回溯性 B. 把待开发的软件系统模块化,将每个模块作为一个增量组件,从而分批次地分析、设计、编码和测试这些增量组件 C. 适用于已有产品或产品原型(样品),只需客户化的工程项目 D. 软件开发过程每迭代一次,软件开发又前进一个层次正确答案:B增量模型增量模型也称为渐增模型,是把待开发的软件系统模块化,将每个模块作为一个增量组件,从而分批次地分析、设计、编码和测试这些增量组件。优点: (1)将待开发的软件系统模块化,可以分批次地

2、提交软件产品,各个阶段并不交付一个可运行的完整产品,而是交付满足客户需求的一个子集的可运行产品,使用户可以及时了解软件项目的进展。 (2)以组件为单位进行开发降低了软件开发的风险。一个开发周期内的错误不会影响到整个软件系统。 (3)开发顺序灵活。开发人员可以对组件的实现顺序进行优先级排序,先完成需求稳定的核心组件。当组件的优先级发生变化时,还能及时地对实现顺序进行调整。缺点 (1)要求待开发的软件系统可以被模块化。如果待开发的软件系统很难被模块化,那么将会给增量开发带来很多麻烦。题目解析 A. 具有可回溯性,可以返回修改; B. 正确; C. 适用于未开发的原型(样品); D. 软件开发过程每

3、迭代一次,软件开发又前进一个层次,属于螺旋模型的软件过程。- 螺旋模型 强烈参考常用软件开发模型比较分析2. 下面有关值类型和引用类型描述正确的是()?A. 值类型的变量赋值只是进行数据复制,创建一个同值的新对象,而引用类型变量赋值,仅仅是把对象的引用的指针赋值给变量,使它们共用一个内存地址。 B. 值类型数据是在栈上分配内存空间,它的变量直接包含变量的实例,使用效率相对较高。而引用类型数据是分配在堆上,引用类型的变量通常包含一个指向实例的指针,变量通过指针来引用实例。 C. 引用类型一般都具有继承性,但是值类型一般都是封装的,因此值类型不能作为其他任何类型的基类。 D. 值类型变量的作用域主

4、要是在栈上分配内存空间内,而引用类型变量作用域主要在分配的堆上。正确答案:A B C(求解析D)值类型 值类型就是现金,要用直接用;引用类型是存折,要用还得先去银行取现。值类型 1.值类型变量都存储在栈中。2.访问值类型变量时,一般都是直接访问其实例。 3.每个值类型变量都有自己的数据副本,因此对一个值类型的变量的操作不会影响其他的变量。 4.复制值类型变量时,复制的是变量的值,而不是变量的地址。 5.值类型变量不能为null,必须具有一个确定的值。引用类型 1.必须在托管堆中为引用类型变量分配内存。2.必须使用new关键字来创建引用类型变量。 3.在托管堆中分配的每个对象都有与之相关联的附加

5、成员,这些成员必须被初始化。 4.引用类型变量是由垃圾回收机制来管理的。 5.多个引用类型变量都可以引用同一个对象,这种情形下,对一个变量的操作会影响另一个变量所引用的同一对象。 6.引用类型被赋值之前的值都是null。 3. 如何在多线程中避免发生死锁?A. 允许进程同时访问某些资源。 B. 允许进程强行从占有者那里夺取某些资源。 C. 进程在运行前一次性地向系统申请它所需要的全部资源。 D. 把资源事先分类编号,按号分配,使进程在申请,占用资源时不会形成环路。官方答案:A B C D 民间答案:B C D死锁在多道程序设计环境下,多个进程可能竞争一定数量的资源。一个进程申请资源,如果资源不

6、可用,那么进程进入等待状态。如果所申请的资源被其他等待进程占有,那么该等待的进程有可能无法改变状态,这种情况下称之为死锁。产生死锁的4个必要条件: 互斥条件:系统存在临界资源,存在一个资源每次只能被一个进程使用,若别的进程也要使用该资源,需要等待知道其占用者用完释放。 保持与等待条件:部分分配,允许进程在不释放其已经分得的资源的情况下请求并等待分配的资源 不可抢占条件:有些系统资源是不可抢占的,系即当某个进程已经获得这种资源后,系统是不能强行收回,其他进程也不能强行夺走,只能由自身使用完释放。 循环等待条件:若干个进程形成环形链,链中的每一个进程都在等待该链中下一个进程所占用的资源。 死锁的预

7、防需要至少破坏死锁的4个必要条件之一,而死锁的避免不去刻意破坏4个必要条件,而是通过对资源的分配策略施加较少的限制条件,来避免死锁的产生。民间解析选项B,破坏不可抢占条件,属于死锁预防 选项C,破坏了保持与等待条件,属于死锁预防 选项D,破坏了循环等待条件,属于死锁预防 参考资料如何在多线程中避免发生死锁4.以下为求0到1000以内所有奇数和的算法,从中选出描述正确的算法( )A. s=0;i=1;s=s+i;i=i+2;如果i1000,则返回;结束 B. s=0;i=1;i=i+2;s=s+i;如果i1000,则返回;结束 C. s=1;i=1;s=s+i;i=i+2;如果i1000,则返回

8、;结束 D. s=1;i=1;i=i+2;s=s+i;如果i1000,则返回;结束正确答案:A5. 关于递归法的说法不正确的是( )A. 程序结构更简洁 B. 占用CPU的处理时间更多 C. 要消耗大量的内存空间,程序执行慢,甚至无法执行 D. 递归法比递推法的执行效率更高正确答案:D民间解析简单的说,递推是在借助前一个几经计算出来的结果去计算下一步的结果,以此来得到最终结果,有此可知递推并不需要保留太多现场信息,而递归就不一样,虽然也是要借助前一步的结果,但这前一步结果往往刚开始是未知的,要一步一步递推下去,直到遇到终结条件,然后在一层一层的回归,直到回归到最上一层计算出结果,可见递归是包含

9、两步的,一个递推下去,一个在回归递归往往表达简单 ,但计算需要时空都比较大6.字符串”ABCD”和字符串”DCBA”进行比较,如果让比较的结果为真,应选用关系运算符()A. B. =正确答案:B字符串比较优先判断对应字符的大小(ASCII码顺序),A”为65;“a”为97;“0”为48;题目解析字符串”ABCD”和字符串”DCBA”,A小于D,则无需继续比较了,符号为 D. 正确答案:D运算符优先级函数算术关系逻辑算数 指数() 取负(-) 乘浮点除(*、/) 整除() 取模(Mod) 加、减(+、-) 连接(&)关系 等于()不等于(!=)小于() 小于等于()大于等于()LikeIs逻辑

10、NotAndOrXorEqv(等价)Imp(蕴含)9.采用哪种遍历方法可唯一确定一棵二叉树?( )A. 给定一棵二叉树的先序和后序遍历序列 B. 给定一棵二叉树的后序和中序遍历序列 C. 给定先序、中序和后序遍历序列中的任意一个即可 D. 给定一棵二叉树的先序和中序遍历序列正确答案:B D二叉树的遍历方法目前做了三套题,二叉树的遍历方法出现了三次。套题知识点X东2019春招京东数据分析类试卷第2题:根据前序和后续遍历,求中序遍历X易2018校园招聘数据分析工程师笔试卷第1题:已知中序遍历,求二叉树的所有可能X东2019校招数据分析工程师笔试题第9题:遍历方法确定唯一的二叉树题目解析前序和后序在

11、本质上都是将父节点与子结点进行分离,但并没有指明左子树和右子树的能力,因此得到这两个序列只能明确父子关系,而不能确定一个二叉树。给出中序遍历之后再给一个其他的遍历就能够确定了。前序遍历+中序遍历后序遍历+中序遍历 可以唯一确定一棵二叉树。10.已知小顶堆:51,32,73,23,42,62,99,14,24,3943,58,65,80,120,请问62对应节点的左子节点是A. 99 B. 73 C. 3943 D. 120官方答案:B 个人答案:65最小/大堆的构建方法,强烈参考最小堆 构建、插入、删除的过程图解 11. 若串S=”UP!UP!JD”,则其子串的数目A. 33 B. 37 C.

12、 39 D. 35正确答案:B 个人答案:31子串串中任意个连续的字符组成的子序列称为该串的子串,是子集的概念,不是集合。空串也属于子串。长度为n的字符串串中字符均不相同 1、有n(n+1)/2 +1个子串; 2、非空子串:n(n+1)/2; 3、非空真子串:n(n+1)/2 1;串中字符出现重复 n(n+1)/2+1-重复个数题目解析UP!UP!JD,有8个字符,n = 8。 n(n+1)/2 + 1 = 37但官方答案没有考虑重复的字符。若考虑重复字符, 1个字符子串重复个数 = 1 + 1 + 1 (U,P,!) 2个字符子串重复个数 = 1 + 1 (UP, P!) 3个字符子串重复个

13、数 = 1 (UP!) 所以, 37 - 6 = 3112. 一颗二叉树的叶子节点有5个,出度为1的结点有3个,该二叉树的结点总个数是?A. 11 B. 12 C. 13 D. 14正确答案:B结点的度:结点拥有的子树的数目叶子结点:度为0的结点分支结点:度不为0的结点树的度:树中结点的最大的度度和结点的关系树中结点数 = 总分叉数 +1即,度为0的节点数为度为2的节点数加1n0 = n2 + 1题目解析已知,n0 = 5, n1 = 3n = n0 + n1 + n2 n0 = n2 + 1 解得 n = 12。13.以下哪种排序算法一趟结束后能够确定一个元素的最终位置?A. 简单选择排序

14、B. 基数排序 C. 堆排序 D. 二路归并排序官方答案:C 民间答案:A C各种排序方法总结简单选择排序,能够取出当前无序序列中最(小or大)值与第一位置的元素互换位置。堆排序每趟总能选出一个最值位于根节点。冒泡排序总是两两比较选出一个最值位于数组前面。快速排序选出的枢轴在一趟排序中就位于了它最终的位置插入排序(直接、二分)不一定会位于最终的位置,因为不确定后面插入的元素对于前面的元素是否产生影响。希尔排序(本质也是插入排序)只在子序列中直接插入排序。所以不能确定。二路归并排序除非在缓存区一次放入所有的序列(这样得不偿失),否则不能确定最终位置。所以只有 简单选择排序、快速排序、冒泡排序、堆

15、排序每一趟排序结束都能确定一个元素最终位置的方法有哪些14. 权值分别为9、3、2、8的结点,构造一棵哈夫曼树,该树的带权路径长度是?A. 36 B. 40 C. 45 D. 46正确答案:B哈夫曼编码的知识点在网易2018校园招聘数据分析工程师笔试卷第二题出现过。 哈夫曼编码的理解和方法,强烈推荐参考哈夫曼编码的理解(Huffman Coding)题目解析带权路径长度 = (2+3)x3 + 8 x 2 + 9 x 1 = 4015. 在()中,只要指出表中任何一个结点的位置,就可以从它出发依次访问到表中其他所有结点。A. 线性单链表 B. 双向链表 C. 线性链表 D. 循环链表正确答案:

16、D题目解析单向链表: 一个节点包含2个信息:值,下一个节点,所以,对于任何一个节点,只能知道它的下一个节点,末尾节点的下一个节点不存在;双向链表:每个结点设置有两个指针,一个指向其前驱,一个指向其后继,这样从任意一个结点开始,既可以向前查找,也可以向后查找,在结点的访问过程中一般从当前结点向链尾方向扫描,如果没有找到,则从链尾向头结点方向扫描,这样部分结点就要被遍历两次,因此不符合题意。循环链表的最后一个结点的指针域指向表头结点,所有结点的指针构成了一个环状链,只要指出表中任何一个结点的位置就可以从它出发访问到表中其他所有的结点。16. 网络管理员把优盘上的源代码给程序员参考,但要防止程序误删

17、除或修改,以下正确的加载方式是( )A. mount -o defaults /dev/sdb1 /tools B. mount -r /dev/sdb1 /tools C. mount -o ro /dev/sdb1 /tools D. mount -o ro /dev/sdb /tools正确答案:B Clinux磁盘管理任何块设备都不能直接访问,需挂载在目录上访问挂载: 将额外文件系统与根文件系统某现存的目录建立起关联关系,进而使得此目录做为其它文件访问入口的行为(挂载的设备必须有文件系统) mount -选项 DEVICE(设备) MOUNT_POINT(挂载点) (1)device

18、:指明要挂载的设备 设备文件:例如/dev/sda5 (2)挂载选项- -r:readonly ,只读挂载,不能进行其他操作,和权限无关,介质只能读,多用于冷备份。在mount 查询时时显示 ro -o options:( 挂载文件系统的选项) ,多个选项使用逗号分隔 -o ro:只读 rw:读写(defaults) 民间解析A- 默认选项错误 D- sdb 和sdb1的差别。sdb表示整个SD卡设备名 sdb1表示SD卡的第一个分区。相应的,如果还有一个分区的话,表示为sdb2 用fdisk -l命令查看U盘的盘符。 一般为/dev/sdb1 17. 下列有关软连接描述正确的是A. 与普通文

19、件没什么不同,inode 都指向同一个文件在硬盘中的区块B. 不能对目录创建软链接 C. 保存了其代表的文件的绝对路径,是另外一种文件,在硬盘上有独立的区块,访问时替换自身路径 D. 不可以对不存在的文件创建软链接官方答案:B 民间答案:C软连接 硬连接若一个 inode 对应多个文件名,则称这些文件为硬链接。换言之,硬链接就是同一个文件使用了多个别名。软连接 软链接与硬链接不同,若文件用户数据块中存放的内容是另一文件的路径名的指向,则该文件就是软连接。软链接就是一个普通文件,只是数据块内容有点特殊。软链接有着自己的 inode 号以及用户数据块。因此软链接的创建与使用没有类似硬链接的诸多限制

20、。 A错误,后半句说的是硬链接,硬链接是共同拥有同一个inode。 B错误,软链接可对文件或目录创建 D错误,可对不存在的文件或目录创建软链接; 18. Ext3日志文件系统的特点是:A. 高可用性 B. 数据的完整性 C. 数据转换快 D. 多日志模式正确答案:A B C DEXT3EXT3是第三代扩展文件系统(英语:Third extended filesystem,缩写为ext3),是一个日志文件系统,常用于Linux操作系统。Ext3日志文件系统特点1、高可用性 系统使用了ext3文件系统后,即使在非正常关机后,系统也不需要检查文件系统。宕机发生后,恢复ext3文件系统的时间只要数十秒

21、钟。 2、数据的完整性 ext3文件系统能够极大地提高文件系统的完整性,避免了意外宕机对文件系统的破坏。 3、文件系统的速度 尽管使用ext3文件系统时,有时在存储数据时可能要多次写数据,但是,从总体上看来,ext3比ext2的性能还要好一些。这是因为ext3的日志功能对磁盘的驱动器读写头进行了优化。 4、数据转换 由ext2文件系统转换成ext3文件系统非常容易,只要简单地键入两条命令即可完成整个转换过程,用户不用花时间备份、恢复、格式化分区等。 5、多种日志模式 Ext3有多种日志模式,一种工作模式是对所有的文件数据及metadata(定义文件系统中数据的数据,即数据的数据)进行日志记录(

22、data=journal模式);另一种工作模式则是只对metadata记录日志,而不对数据进行日志记录,也即所谓data=ordered或者data=writeback模式。19. DHCP是动态主机配置协议的简称,其作用是A. 动态分配磁盘资源 B. 动态分配内存资源 C. 为网络中的主机分配IP地址 D. 为集群中的主机分配IP地址正确答案:CDHCP动态主机设置协议(英语:Dynamic Host Configuration Protocol,DHCP)是一个局域网的网络协议,使用UDP协议工作,主要有两个用途: (1)用于内部网或网络服务供应商自动分配IP地址; (2)给用户用于内部网

23、管理员作为对所有计算机作中央管理的手段。20. 以下命令可以用于获取本地ip地址的是:A. ifconfig B. uptime C. top D. netstat正确答案:A题目解析A. ifconfig:获取本地ip地址; B.uptime:显示系统已经运行了多长时间,它依次显示下列信息:当前时间、系统已经运行了多长时间、目前有多少登陆用户、系统在过去的1分钟、5分钟和15分钟内的平均负载; C. top:查看linux系统的CPU、内存、运行时间、交换分区、执行的线程等信息; D.netstat:列出系统上所有的网络套接字连接情况,包括 tcp, udp 以及 unix套接字,另外它还能

24、列出处于监听状态(即等待接入请求)的套接字。 21. 以下命令可以用于获取本机cpu使用率的是:A. ifconfig B. uptime C. top D. netstat正确答案:C 参考第20题解析。22. 以下命令用于设置环境变量的是:A. export B. cat C. echo D. env正确答案:A关于环境变量的命令export: 设置环境变量 echo:查看是否成功 env:显示所有的环境变量 set:显示所有本地定义的Shell变量 unset:清除环境变量23. 下列对TCP/IP结构及协议分层不正确的是:A. 网络接口层:Wi-Fi、ATM 、GPRS、EVDO、HS

25、PA。 B. 网际层:IP、ICMP、IGMP 。 C. 传输层:TCP、UDP、TLS、ssh。 D. FTP、TELNET、DNS、SMTP.正确答案:CTCP/IP协议TCP/IP协议(传输控制协议/互联网协议)不是简单的一个协议,而是一组特别的协议,包括:TCP,IP,UDP,ARP等,这些被称为子协议。在这些协议中,最重要、最著名的就是TCP和IP。因此,大部分网络管理员称整个协议族为“TCP/IP”。24. 以下哪种设备工作在数据链路层?A. 中继器 B. 集线器 C. 交换机 D. 路由器正确答案:COSI七层模型涉及的主要设备物理层的主要设备:中继器、集线器。数据链路层主要设备

26、:二层交换机、网桥网络层主要设备:路由器25. 打电话使用的数据传输方式是(),手机上网使用的数据传输方式是()?A. 电路交换,电路交换 B. 电路交换,分组交换 C. 分组交换,分组交换 D. 分组交换,电路交换正确答案:B电路交换是以电路为目的的交换方式,即通信双方要通过电路建立联系,建立后没挂断则电路一直保持,实时性高。分组交换是把信息分为若干分组,每个分组有分组头含有选路和控制信息,可以到达收信方,但是不能即时通信 26. 后退N帧协议的发送窗口大小是(),接收窗口的大小是()?A. =1,=1 B. =1,1 C. 1,1 D. 1,=1正确答案:D后退N帧ARQ协议对传统的自动重

27、传请求(ARQ,Automatic Repeat reQues)进行了改进,从而实现了在接收到ACK之前能够连续发送多个数据包。 注:ACK:在TCP/IP协议中,如果接收方成功的接收到数据,那么会回复一个ACK数据。通常ACK信号有自己固定的格式,长度大小,由接收方回复给发送方。接收窗口接收到分组就向前移动。发送窗口接受到接收窗口发送的ACK才会向前移动。后退N帧协议的最大发送窗口为2n-1(其中n为帧号的位数),最小为1, 接收窗口大小始终为1。27.TCP释放连接第二次挥手时ACK(),第三次挥手时ACK()?A. 不存在,不存在, B. 不存在,值是1 C. 值是1,值是1 D. 值是

28、1,不存在答案:C民间解析TCP连接建立阶段:第一次握手:客户端的应用进程主动打开,并向客户端发出请求报文段。其首部中:SYN=1,seq=x。第二次握手:服务器应用进程被动打开。若同意客户端的请求,则发回确认报文,其首部中:SYN=1,ACK=1,ack=x+1,seq=y。第三次握手:客户端收到确认报文之后,通知上层应用进程连接已建立,并向服务器发出确认报文,其首部:ACK=1,ack=y+1。当服务器收到客户端的确认报文之后,也通知其上层应用进程连接已建立。连接释放阶段:第一次挥手:数据传输结束以后,客户端的应用进程发出连接释放报文段,并停止发送数据,其首部:FIN=1,seq=u。第二

29、次挥手:服务器端收到连接释放报文段之后,发出确认报文,其首部:ack=u+1,seq=v。此时本次连接就进入了半关闭状态,客户端不再向服务器发送数据。而服务器端仍会继续发送。第三次挥手:若服务器已经没有要向客户端发送的数据,其应用进程就通知服务器释放TCP连接。这个阶段服务器所发出的最后一个报文的首部应为:FIN=1,ACK=1,seq=w,ack=u+1。第四次挥手:客户端收到连接释放报文段之后,必须发出确认:ACK=1,seq=u+1,ack=w+1。 再经过2MSL(最长报文端寿命)后,本次TCP连接真正结束,通信双方完成了他们的告别。因此应选B 28. TCP协议的拥塞控制就是防止过多

30、的数据注入到网络中,这样可以使网络中的路由器或链路不致过载。常用的方法有:A. 慢启动、窗口滑动 B. 慢开始、拥塞控制 C. 快重传、快恢复 D. 快开始、快恢复正确答案:B CTCP拥塞控制慢启动、拥塞避免、快重传、快启动强烈参考TCP拥塞控制-慢启动、拥塞避免、快重传、快启动29. 对于京东商城高流量访问,预防Ddos的方法可以有?A. 限制同时打开SYN半链接的数目。 B. 缩短SYN半链接的Time out 时间。 C. 关闭不必要的服务。 D. 限制客户端请求服务器时长。正确答案:A B CDdos分布式拒绝服务攻击(Distributed Denial of Service,简称DDoS)是指处于不同位置的多

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1