数据仓库面试题文档格式.docx

上传人:b****4 文档编号:16587524 上传时间:2022-11-24 格式:DOCX 页数:7 大小:18.75KB
下载 相关 举报
数据仓库面试题文档格式.docx_第1页
第1页 / 共7页
数据仓库面试题文档格式.docx_第2页
第2页 / 共7页
数据仓库面试题文档格式.docx_第3页
第3页 / 共7页
数据仓库面试题文档格式.docx_第4页
第4页 / 共7页
数据仓库面试题文档格式.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

数据仓库面试题文档格式.docx

《数据仓库面试题文档格式.docx》由会员分享,可在线阅读,更多相关《数据仓库面试题文档格式.docx(7页珍藏版)》请在冰豆网上搜索。

数据仓库面试题文档格式.docx

2、Oracle数据库,有哪几类索引,分别有什么特点?

a)1.单列索引与复合索引

索引列

一个索引可以由一个或多个列组成,用来创建索引的列被称为单列索引是基于单列所创建的索引,复合索引是基于两列或者多列所创建的索

引。

2.唯一索引与非唯一索引

唯一索引是索引列值不能重复的索引,非唯一索引是索引列可以重复的索引。

无论是唯一索引还是非唯一索引,索引列都允许取NULL值。

默认情况下,Oracle创建的索引是不唯一索引。

3.B树索引

B树索引是按B树算法组织并存放索引数据的,所以B树索引主要依赖其组织

并存放索引数据的算法来实现快速检索功能。

4.位图索引

位图索引在多列查询时,可以对两个列上的位图进行AND和OR操作,达到更

好的查询效果。

5.函数索引

Oracle中不仅能够直接对表中的列创建索引,还可以对包含列的函数或表达式创建索引,这种索引称为“位图索引”。

3、Union与UnionAll的区别?

a)Union会对查询结果进行排序去重,效率比unionall低,unionall只是两个查询集的合并操作。

建议使用Unionall,查询出来后再对数据进行去重操作。

4、对游标的理解?

游标的分类?

使用方法?

游标是映射在结果集中一行数据的位置实体,有了游标,用户就可以访问结果集中的任何一条数据。

游标分为静态游标和REF游标,静态游标分为显示游标和隐式游标,

显示游标使用步骤是声明游标,打开游标,获取记录,关闭游标。

所有的

DML语句为

隐式游标,可以从游标的属性获得sql语句的信息。

REF游标是动态关联结果集的临时

对象,使用步骤也是先要进行声明游标,然后打开游标,获取记录,关闭游标。

5、如何查找和删除表中的重复数据?

给出方法或SQL。

查询表中重复数据。

Select*frompeoplewhereidin(Selectidfrompeoplegroupbyidhavingcount(id)>

1);

Deletefrompeoplewhereidin(selectidfrompeoplegroupbyidhavingcount(id)>

1)

androwidnotin(selectmin(rowid)frompeoplegroupbyidhacingcount(id)>

创建索引有哪些需要注意的要点?

a)一般来说,不需要为比较小的表创建索引(数据占用存储空间小)

b)即使是大表,如果经常需要查询的数据不超过10%到15%的话,那就没有必要为

其建立索引的必要。

c)如对于一些重复内容比较少的列,特别是对于那些定义了唯一约束的列。

在这些列

上建立索引,往往可以起到非常不错的效果。

d)数据库管理员,需要隔一段时间,如一年,对数据库的索引进行优化。

该去掉的去

掉,该调整的调整,以提高数据库的性能。

e)通常来说,表的索引越多,其查询的速度也就越快。

但是,表的更新速度则会降低。

这主要是因为表的更新(如往表中插入一条记录)速度,反而随着索引的增加而增加。

f)对于一些数据仓库或者决策型数据库系统,其主要用来进行查询。

g)位图索引。

基数是位图索引中的一个基本的定义,它是指数据库表中某个字段内容

中不重复的数值。

6、Oracle数据库中,有哪几种分区?

各自特点是什么?

作用是什么?

分区索引的分

类和作用?

范围分区,散列分区,复合分区,索引分区

7、表T(a,b,c,d),要根据字段c排序后取第21—30条记录显示,请给出sql。

select*from(selectc.*,rownumasrnfrom(select*fromtorderbyc)c)wherernberween21and30;

&

怎样优化数据库?

i.首先应确定那里出现性能问题,一般一个调度时常都会有时间log

记录,若发现某个调度时间过长,那么我们可以使用oracle自带

profiler进行诊断出该模块出现性能问题的sql。

ii.找出问题sql后对表大小进行分析,知道哪些是大表和小表。

iii.查看该sql执行计划(用autotrace)即可大概找出问题原因。

iv.查询方面:

查看是否未走索引,或sql写法中有运算或<

>

等影响走

索引条件,或并未对关键关联字段创建索引,必要情况重建索引。

v.删除更新情况,尽量使用rowid。

9、华为开发流程是什么(CMMI)

a)华为接口人或业务提出需求文档。

b)我们根据需求文档写入概要设计。

c)根据概要设计进行开发。

d)开发完成后进行ut测试

e)编写详细设计。

f)上线后编写产品文档

二、

ETL工具

1、

Informatica

中,

Update组件叫什么?

更新机制?

2、

LookUp组件有哪几类?

区别是什么?

3、

如何调用存储过程?

4、

工作流控制有哪些组件?

5、

优化方案?

6、

DataStage

的JOB有哪些类型?

特点分别是什么?

7、

如何设置paralleljob并行运行?

8、

JoinStage与LookupStage组件在使用上有何区别?

9、

的优化方案?

10、什么是维度?

人们观察数据的特定角度。

例如,一个企业在考虑产品的销售情况时,通常从时间、

地区和产品的不同角度来深入观察产品的销售情况。

这里的时间、地区和产品就是

维。

11、事实表、维度表是什么?

12、事实表:

就是所有需要统计值的表;

维度表:

根据时间或地区需要分析的数据表。

13、DW维表分类

a)1.一致性维度

b)2.杂项维度

c)3.角色类

14、缓慢变化维

a)随着时间的推移维度中的属性,慢慢会改变。

例如一个产品销售地区之前为国

内省,现在上国际,为各个国家。

15、ETL分别是Extract”“Transform”、Load。

16、datastage优点

a)优点在于,把复杂的工作,分解成,易查错的job。

三、模型设计

1、有哪几种模型设计方法?

2、模型设计的步骤?

确定该业务过程每个事实表的粒度确定维度的属性

确定维度的层次

确定每个事实所需要关联的维度确定数字型事实,包括预先计算的确定缓慢变化维

3、维度模型的设计方法?

4、模型设计的思路?

业务需求驱动?

数据驱动?

3、模型设计经验说明。

在概念模型设计、逻辑模型设计以及物理模型设计几个阶段主

要的工作是什么?

四、

Cognos开发

Cube刷新方案?

报表数据权限控制方案?

Cube增量刷新方案?

五、

Shell开发

在Unix/Linux中,查看磁盘空间可以用哪些命令?

在Unix/Linux中,压缩和解压缩文件可以用哪些命令?

sed命令的作用?

在Unix/Linux中,添加用户用什么命令?

在Unix/Linux中,查看文件行数什么命令?

六、

数据仓库设计

增量数据获取方案?

请解释以下概念:

数据集市、事实表、维度表、OLAP

元数据管理在数据仓库中的运用有何心得?

数据仓库系统的数据质量如何保证?

方案?

数据仓库系统组件接口设计方案?

七、项目管理八、其他

1、能否出差?

2、期望薪资待遇多少?

3、个人发展方向?

WelcomeTo

Download!

!

欢迎您的下载,资料仅供参考!

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 求职职场 > 简历

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1