研究生毕业论文开题报告模板doc文档格式.docx

上传人:b****2 文档编号:15103900 上传时间:2022-10-27 格式:DOCX 页数:25 大小:26.61KB
下载 相关 举报
研究生毕业论文开题报告模板doc文档格式.docx_第1页
第1页 / 共25页
研究生毕业论文开题报告模板doc文档格式.docx_第2页
第2页 / 共25页
研究生毕业论文开题报告模板doc文档格式.docx_第3页
第3页 / 共25页
研究生毕业论文开题报告模板doc文档格式.docx_第4页
第4页 / 共25页
研究生毕业论文开题报告模板doc文档格式.docx_第5页
第5页 / 共25页
点击查看更多>>
下载资源
资源描述

研究生毕业论文开题报告模板doc文档格式.docx

《研究生毕业论文开题报告模板doc文档格式.docx》由会员分享,可在线阅读,更多相关《研究生毕业论文开题报告模板doc文档格式.docx(25页珍藏版)》请在冰豆网上搜索。

研究生毕业论文开题报告模板doc文档格式.docx

其二,作者自2013年4月在XXX实习过程中进一步了解到,因为关系数据库在存储数据格式方面的局限,以及其Schema机制带来的扩展性上的不便,目前在大部分的大数据应用环境中都采用非结构化的数据库,如列式存储的Hbase,文档型存储的MangoDB,图数据库neo4j等。

这些非结构化数据库因为可扩展性强、资源利用率高,高并发、响应速度快等优势,在大数据应用环境中得到了广泛的应用。

但此种应用只解决了前端的业务处理,要真正利用大数据实现商务智能,还需要为决策支持系统和联机分析应用等提供一数据环境——数据仓库。

为此,导师指导本文作者拟此题目,研究基于Hadoop框架的数据仓库解决方案。

二、研究目的和意义:

现如今,数据已经渗透到每一个行业,成为重要的生产因素。

近年来,由于历史积累和和数据增长速度加快,各行业都面临着大数据的难题。

事实上,大数据既是机遇又时挑战。

合理、充分利用大数据,将其转变为海量、高增长率和多样化的信息资产,将使得企业具有更强的决策力、洞察发现力和流程优化等能力。

因此,很多IT企业都将大数据作为其重要的发展战略,如亚马逊、FaceBook已布局大数据产业,并取得了骄人的成绩。

事实上,不止谷歌、易趣网或亚马逊这样的大型互联网企业需要发展大数据,任何规模的企业都有机会从大数据中获得优势,并由此构建其未来业务分析的基础,在与同行的竞争中,取得显著的优势。

相较于大型企业,中小企业的大数据发展战略不同。

大公司可以凭借雄厚的资本和技术实力,从自身环境和业务出发,开发自己的软件平台。

而中小企业没有那样的技术实力,也没有那么庞大的资金投入,更倾向于选择一个普遍的、相对廉价的解决方案。

本文旨在分析大数据环境下数据库的特点,结合当下流行的Hadoop框架,提出了一种适用于大数据环境的数据仓库的解决方案并实现。

为中小企业在大数据环境中构建数据仓库提供参考。

其具体说来,主要有以下三方面意义:

首先,目前主流的数据库如Oracle、SQLServer都有对应自己数据库平台的一整套的数据仓库解决方案,对于其他的关系型数据库如MySQL等,虽然没有对应数据库平台的数据仓库解决方案,但有很多整合的数据仓库解决方案。

而对于非结构化的数据库,因其数据模型不同于关系型数据库,需要新的解决方案,本文提出的基于Hive/Pentaho的数据仓库实现方案可以为其提供一个参考。

其次,通过整合多源非结构化数据库,生成一个面向主题、集成的数据仓库,可为大数据平台上的联机事务处理、决策支持等提供数据环境,从而有效利用数据资源辅助管理决策。

再次,大数据是一个广泛的概念,包括大数据存储、大数据计算、大数据分析等各个层次的技术细节,本文提出的“大数据环境下的数据仓库解决方案及实现“丰富了大数据应用技术的生态环境,为大数据环境下的数据分析、数据挖掘等提供支撑。

三、国内外研究现状和发展趋势的简要说明:

本文研究的主体是数据仓库,区别于传统基于关系型数据库的数据仓库,本文聚焦大数据环境下基于非结构数据库的数据仓库的构建与实现。

因此,有必要从数据仓库和大数据环境下的数据库两方面进行阐述。

(一)数据仓库国内外研究现状自从BillInmon在1990年提出“数据仓库”这一概念之后,数据仓库技术开始兴起,并给社会带来新的契机,逐渐成为一大技术热点。

目前,美国30%到40%的公司已经或正在建造数据仓库。

现如今随着数据模型理论的完善,数据库技术、应用开发及挖掘技术的不断进步,数据仓库技术不断发展,并在实际应用中发挥了巨大的作用。

以数据仓库为基础,以联机分析处理和数据挖掘工具为手段的决策支持系统日渐成熟。

与此同时,使用数据仓库所产生的巨大效益又刺激了对数据仓库技术的需求,数据仓库市场正以迅猛的势头向前发展。

我国企业信息化起步相对较晚,数据仓库技术在国内的发展还处于积累经验阶段。

虽然近年来,我国大中型企业逐步认识到利用数据仓库技术的重要性,并已开始建立自己的数据仓库系统,如中国移动、中国电信、中国联通、上海证券交易所和中国石油等。

但从整体上来看,我国数据仓库市场还需要进一步培育,数据仓库技术同国外还有很大差距。

为此,我国许多科技工作者已开始对数据仓库相关技术进行深入研究,通过对国外技术的吸收和借鉴,在此基础上提出适合国内需求的技术方案。

(二)非结化数据库国内外研究现状随着数据库技术深入应用到各个领域,结构化数据库逐渐显露出一些弊端。

如在生物、地理、气候等领域,研究面对的数据结构并不是传统上的关系数据结构。

如果使用关系数据库对其进行存储、展示,就必须将其从本身的数据结构强行转换为关系数据结构。

采用此种方式处理非结构数据,不能在整个生命周期内对非关系数据进行管理,并且数据间的关系也无法完整的表示出来。

在此背景下,非结构化数据库应运而生。

相较于关系数据库,非结构数据库的字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成。

如此,它不仅可以处理结构化数据,更能处理文本、图象、声音、影视、超媒体等非结构化数据。

近年来,随着大数据兴起,非结构数据库开始广泛应用,以支持大数据处理的多种结构数据。

目前,非结构化的数据库种类繁多,按其存储数据类型分,主要包含内存数据库、列存储型、文档数据库、图数据库等。

其中,常见的内存数据库有SQLite,Redis,Altibase等;

列存储数据库有Hbase,Bigtable等;

文档数据库有MangoDB,CouchDB,RavenDB等;

图数据库有Neo4j等。

近年来,我国非结构数据库也有一定发展,其中代表的是国信贝斯的iBASE数据库。

可以预见在不久的将来,伴随这大数据的应用,非结构数据库将会得到长足的发展和广泛的应用。

四、主要研究内容和要求达到的深度:

本文研究的方向是数据仓库,并且是聚焦于大数据这一特定环境下的数据仓库建设,其主要内容包括以下几点:

1.非结构数据库的数据仓库解决方案:

本文聚焦于大数据这一特定环境下的数据仓库建设,因为大数据环境下的数据仓库建设理论文献很少,首先需要以研究关系数据库型数据仓库的解决方案为参考,然后对比关系数据库和非结构数据库的特点,最后在参考方案的基础上改进,以得到适合非结构数据库环境的数据仓库解决方案。

2.非结构数据库和关系数据库间数据转换:

非结构数据库是对关系数据库的补充,很多非结构数据库应用环境中都有关系数据库的身影。

因此,非结构数据库和关系数据库间数据转换是建立非结构数据库需要解决的一个关键问题。

3.基于非结构数据库的数据仓库构建:

本文拟采用手礼网的数据,分析其具体的数据环境和需求,为其构建基于非结构数据库的数据仓库,主要包括非结构数据库的数据抽取,Hive数据库入库操作和Pentaho前台数据展现等。

五、研究工作的主要阶段、进度和完成时间:

结合研究需要和学校教务管理的安排,研究工作主要分以下四阶段完成:

第一阶段:

论文提纲:

20XX年6月——7月第二阶段:

论文初稿:

20XX年8月——10月第三阶段:

论文修改:

20XX年11月——2014年3月第四阶段:

最终定稿:

20XX年4月六、拟采用的研究方法、手段等及采取的措施:

在论文提纲阶段,本文拟采用调查统计的方法,收集目前大数据环境下数据库应用情况,着重统计各类型数据库的应用比例。

同时采用文献分析和个案研究的方法研究数据仓库构建的一般过程和对应的技术细节,并提出解决方案。

在论文初稿和修改阶段,本文拟通过实证研究,依据提纲阶段在文献分析中收集到的理论,基于特定的实践环境,理论结合实践,实现某一具体数据仓库的构建。

最后采用定性和定量相结合的方法,详细介绍大数据环境下数据库和数据仓库的特点,其数据仓库实现的关键问题及解决方案,以及数据仓库个例实现的详细过程。

七、可能遇见的困难、问题及拟采取的解决办法、措施:

基于本文的研究内容和特点分析,本文在研究过程中最有可能遇到三个关键问题。

其一,非结构数据库种类繁多,每类数据库又对应有不同的数据库产品,由于当下非结构数据库没有统一标准,即便同类数据库下不同产品的操作都不尽相同,难以为所有非结构数据库提出解决方案。

针对此问题,本文拟紧贴大数据这一背景,选择当下大数据环境中应用最多的几类数据库的代表性产品进行实现。

其二,虽然经过二十年的发展,数据仓库的理论已日趋完善,但大数据是近几年才发展起来的技术热点,大树据环境下的数据仓库建设理论文献很少。

针对此问题,本文拟参考现有的成熟的关系数据库环境下数据仓库构建方案和非结构化数据仓库理论,研究适合非结构数据库的数据仓库构建方案,请导师就方案进行指导,然后再研究具体技术细节实现方案。

其三,基于大数据环境的数据仓库实现是本文重要的组成部分,要完成此部分的工作需要企业提供数据支持,但现在数据在企业当中的保密级别都很高,一般企业都不会将自己的业务数据外传。

针对此问题,本文拟采用企业非核心业务数据进行数据仓库实现。

八、大纲本文的基本构想和思路,文章拟分为导论、大数据环境下的数据库介绍、大数据下数据仓库关键问题研究、基于XX电子商务的大数据下数据仓库实现、结论五部分。

导论一、研究背景二、国内外研究现状述评三、本文的主要内容与研究思路第一章大数据环境下的数据库介绍第一节大数据对数据库的要求第二节关系数据库和非结构数据库比较第三节大数据下常用非结构数据库介绍小结第二章大数据下数据仓库关键问题研究第一节非结构数据模型和关系数据模型的转换第二节基于多源非结构数据库的数据抽取第三节数据类型转换第四节数据仓库前端展示第三章大数据下数据仓库实现方案第一节大数据环境介绍第二节实现方案第二节Hive介绍第三节Pentaho介绍第四章基于XX电子商务的大数据下数据仓库实现第一节需求分析第二节模型设计第三节概要设计第四节基于Hive的数据入库操作实现第五节基于Pentaho的数据仓库前端展示实现结论

2018年一级建造师《矿业工程》精选题及答案(九)

 

-

安全事故调查处理的“四不放过”原则中不包括(  )。

  A.

事故原因没查清不放过

  B.

经济损失未消除不放过

  C.

责任人员没处理不放过

  D.

整改措施没落实不放过

  2、

关于钻井法凿井的钻井与井壁施工的先后关系,说法正确的是(  )。

钻完后下沉井壁

钻一段沉一段

先下沉后钻井

与钻头同时跟进

  3、

关于采用崩落采矿法需要的条件,说法正确的是(  )。

要求允许地表有陷落

围岩不允许坍落

需要有支护维护岩柱稳定

采空区需要靠充填来维护

  4、

按照验收规定,对于深度不超过600m的普通法凿井,井筒建成后的总漏水量和井壁集中漏水孔的漏水量分别不得大于(  )。

6m3/h、0.5m3/h

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报 > 其它

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1