大数据库大数据结构面试题.docx

资源描述

大数据库大数据结构面试题.docx

《大数据库大数据结构面试题.docx》由会员分享，可在线阅读，更多相关《大数据库大数据结构面试题.docx（9页珍藏版）》请在冰豆网上搜索。

大数据库大数据结构面试题.docx

大数据库大数据结构面试题

常见的数据库基础面试题大全

1.数据抽象：

物理抽象、概念抽象、视图级抽象,内模式、模式、外模式

2.SQL语言包括数据定义、数据操纵（DataManipulation）,数据控制（DataControl）

数据定义：

CreateTable,AlterTable,DropTable,Craete/DropIndex等

数据操纵：

Select,insert,update,delete,

数据控制：

grant,revoke

3.SQL常用命令：

CREATETABLEStudent（

IDNUMBERPRIMARYKEY,

NAMEVARCHAR2（50）NOTNULL）;//建表

CREATEVIEWview_nameAS

Select*FROMTable_name;//建视图

CreateUNIQUEINDEXindex_nameONTableName（col_name）;//建索引

INSERTINTOtablename{column1,column2,…}values（exp1,exp2,…）;//插入

INSERTINTOViewname{column1,column2,…}values（exp1,exp2,…）;//插入视图实际影响表

UPDATEtablenameSETname=’zang3’condition;//更新数据

DELETEFROMTablenameWHEREcondition;//删除

GRANT（Select,delete,…）ON（对象）TOUSER_NAME[WITHGRANTOPTION];//授权

REVOKE（权限表）ON（对象）FROMUSER_NAME[WITHREVOKEOPTION]//撤权

列出工作人员及其领导的名字：

SelectE.NAME,S.NAMEFROMEMPLOYEEES

WHEREE.SUPERName=S.Name

4.视图：

5.完整性约束：

实体完整性、参照完整性、用户定义完整性

6.第三范式：

1NF:

每个属性是不可分的。

2NF:

若关系R是１NF,且每个非主属性都完全函数依赖于R的键。

例SLC（SID#,CourceID#,SNAME,Grade）,则不是2NF;3NF:

若R是2NF，且它的任何非键属性都不传递依赖于任何候选键。

7.ER（实体/联系）模型

8.索引作用

9.事务：

是一系列的数据库操作，是数据库应用的基本逻辑单位。

事务性质：

原子性、

原子性。

即不可分割性，事务要么全部被执行，要么就全部不被执行。

一致性或可串性。

事务的执行使得数据库从一种正确状态转换成另一种正确状态

隔离性。

在事务正确提交之前，不允许把该事务对数据的任何改变提供给任何其他事务，

持久性。

事务正确提交后，其结果将永久保存在数据库中，即使在事务提交后有了其他故障，事务的处理结果也会得到保存。

10.锁：

共享锁、互斥锁

两段锁协议：

阶段１：

加锁阶段阶段２：

解锁阶段

11.死锁及处理：

事务循环等待数据锁，则会死锁。

死锁处理：

预防死锁协议，死锁恢复机制

12.存储过程：

存储过程就是编译好了的一些sql语句。

1.存储过程因为SQL语句已经预编绎过了，因此运行的速度比较快。

2.可保证数据的安全性和完整性。

通过存储过程可以使没有权限的用户在控制之下间接地存取数据库，从而保证数据的安全。

通过存储过程可以使相关的动作在一起发生，从而可以维护数据库的完整性。

3.可以降低网络的通信量。

存储过程主要是在服务器上运行，减少对客户机的压力。

4：

存储过程可以接受参数、输出参数、返回单个或多个结果集以及返回值。

可以向程序返回错误原因

5：

存储过程可以包含程序流、逻辑以及对数据库的查询。

同时可以实体封装和隐藏了数据逻辑。

13.触发器：

当满足触发器条件，则系统自动执行触发器的触发体。

触发时间：

有before,after.触发事件：

有insert,update,delete三种。

触发类型：

有行触发、语句触发

14.内联接,外联接区别？

内连接是保证两个表中所有的行都要满足连接条件，而外连接则不然。

在外连接中，某些不满条件的列也会显示出来，也就是说，只限制其中一个表的行，而不限制另一个表的行。

分左连接、右连接、全连接三种

² 简要叙述一下SQLServer2000中使用的一些数据库对象

表格、视图、用户定义的函数，存储过程，触发器等。

² NULL是什么意思

NULL这个值表示UNKNOWN（未知）:

它不表示“”（空字符串）。

假设您的SQLServer数据库里有ANSI_NULLS，当然在默认情况下会有，对NULL这个值的任何比较都会生产一个NULL值。

您不能把任何值与一个 UNKNOWN值进行比较，并在逻辑上希望获得一个答案。

您必须使用ISNULL操作符。

使用ISNULL（var，value）来进行NULL判断：

当var为NULL的时候，var=value，并且返回value

² 什么是索引?

SQLServer2000里有什么类型的索引?

索引是一个数据结构，用来快速访问数据库表格或者视图里的数据。

在SQLServer里，它们有两种形式:

聚集索引和非聚集索引。

聚集索引在索引的叶级保存数据。

这意味着不论聚集索引里有表格的哪个（或哪些）字段，这些字段都会按顺序被保存在表格，物理顺序和逻辑顺序一致。

由于存在这种排序，所以每个表格只会有一个聚集索引。

非聚集索引在索引的叶级有一个行标识符。

它允许每个表格有多个非聚集索引。

² 什么是主键?

什么是外键?

主键是表格里的（一个或多个）字段，只用来定义表格里的行;主键里的值总是唯一的。

外键是一个用来建立两个表格之间关系的约束。

这种关系一般都涉及一个表格里的主键字段与另外一个表（可能是同一表）里的字段。

那么这些相连的字段就是外键。

² 什么是触发器?

SQLServer2000有什么不同类型的触发器?

有INSTEAD-OF和AFTER两种触发器。

触发器是一种专用类型的存储过程，它被捆绑到表格或者视图上。

INSTEAD-OF触发器是替代数据操控语言（DML）语句对表格执行语句的存储过程。

例如，如果我有一个用于TableA的INSTEAD-OF-UPDATE触发器，同时对这个表格执行一个更新语句，那么INSTEAD-OF-UPDATE触发器里的代码会执行，而不是我执行的更新语句则不会执行操作。

AFTER触发器要在DML语句在数据库里使用之后才执行。

这些类型的触发器对于监视发生在数据库表格里的数据变化十分好用。

² 您如何确一个带有名为Fld1字段的TableB表格里只具有Fld1字段里的那些值，而这些值同时在名为TableA的表格的Fld1字段里?

第一个答案（而且是您希望听到的答案）是使用外键限制。

外键限制用来维护引用的完整性integrity。

它被用来确保表格里的字段只保存有已经在不同的（或者相同的）表格里的另一个字段里定义了的值。

这个字段就是候选键（通常是另外一个表格的主键）。

另外一种答案是触发器。

触发器可以被用来保证以另外一种方式实现与限制相同的作用，但是它非常难设置与维护，而且性能一般都很糟糕。

由于这个原因，微软建议开发人员使用外键限制而不是触发器来维护引用的完整性。

² 对一个投入使用的在线事务处理表格（OLTP）有过多索引需要有什么样的性能考虑?

对一个表格的索引越多，数据库引擎用来更新、插入或者删除数据所需要的时间就越多，因为在数据操控发生的时候索引也必须要维护。

² 你可以用什么来确保表格里的字段只接受特定范围里的值?

Check限制，它在数据库表格里被定义，用来限制输入该列的值。

触发器也可以被用来限制数据库表格里的字段能够接受的值，但是这种办法要求触发器在表格里被定义，这可能会在某些情况下影响到性能。

² 返回参数总是由存储过程返回，它用来表示存储过程是成功还是失败。

返回参数总是INT数据类型。

OUTPUT参数明确要求由开发人员来指定，它可以返回其他类型的数据，例如字符型和数值型的值。

（可以用作输出参数的数据类型是有一些限制的。

）您可以在一个存储过程里使用多个OUTPUT参数，而您只能够使用一个返回参数。

² 什么是相关子查询?

如何使用这些查询?

相关子查询是一种包含子查询的特殊类型的查询。

查询里包含的子查询会真正请求外部查询的值，从而形成一个类似于循环的状况。

11. 某一列允许NULL值，但希望确保所有的非空（Non-NULL）值都是唯一的

SQLServer没有实现非NULL值唯一性的内建机制，因此需要通过自定义的trigger：

算法题目

概述

有过面试经历的企业（BAT、小米、宜信、猿题库、FreeWheel等）当中，还没有谁问过我需要复杂算法（比方说此链接中的很多知识点）才能解决的问题。

我遇到的算法题目大致可以分为两类：

∙经典算法实现题快速排序、归并排序、堆排序、KMP算法等都是重点，重要的是代码的正确性，其次是复杂度分析，当然，人家也不都是直接问你怎么实现这个具体算法，而是包装到情境里；

∙思维益智题考察你分析问题的能力，大部分可以归结到二分、动态规划、递归上，重要的是思路，其次是尽量低的复杂度，再次是代码的正确性。

第一章数据结构与算法

一.算法的基本概念

计算机解题的过程实际上是在实施某种算法，这种算法称为计算机算法。

1.算法的基本特征：

可行性，确定性，有穷性，拥有足够的情报。

2.算法的基本要素：

算法中对数据的运算和操作、算法的控制结构。

3.算法设计的基本方法：

列举法、归纳法、递推、递归、减半递推技术、回溯法。

4.算法设计的要求：

正确性、可读性、健壮性、效率与低存储量需求

二.算法的复杂度

1.算法的时间复杂度：

指执行算法所需要的计算工作量

2.算法的空间复杂度：

执行这个算法所需要的内存空间

三.数据结构的定义

1.数据的逻辑结构：

反映数据元素之间的关系的数据元素集合的表示。

数据的逻辑结构包括集合、线形结构、树形结构和图形结构四种。

2.数据的存储结构：

数据的逻辑结构在计算机存储空间种的存放形式称为数据的存储结构。

常用的存储结构有顺序、链接、索引等存储结构。

四.数据结构的图形表示：

在数据结构中，没有前件的结点称为根结点；没有后件的结点成为终端结点。

插入和删除是对数据结构的两种基本运算。

还有查找、分类、合并、分解、复制和修改等。

五.线性结构和非线性结构

根据数据结构中各数据元素之间前后件关系的复杂程度，一般将数据结构分为两大类型：

线性结构和非线性结构。

线性结构：

非空数据结构满足：

有且只有一个根结点；每个结点最多有一个前件，最多只有一个后件。

非线性结构：

如果一个数据结构不是线性结构，称之为非线性结构。

常见的线性结构：

线性表、栈、队列

六.线性表的定义

线性表是n个元素构成的有限序列（A1，A2，A3……）。

表中的每一个数据元素，除了第一个以外，有且只有一个前件。

除了最后一个以外有且只有一个后件。

即线性表是一个空表，或可以表示为（a1,a2,……an）,其中ai（I=1,2,……n）是属于数据对象的元素，通常也称其为线性表中的一个结点。

非空线性表有如下一些特征：

（1）有且只有一个根结点a1,它无前件；

（2）有且只有一个终端结点an，它无后件；

（3）除根结点与终端结点外，其他所有结点有且只有一个前件，也有且只有一个后件。

线性表中结点的个数n称为线性表的长度。

当n=0时称为空表。

七.线性表的顺序存储结构

线性表的顺序表指

展开阅读全文