数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx

上传人:b****6 文档编号:8414987 上传时间:2023-01-31 格式:DOCX 页数:10 大小:23.67KB
下载 相关 举报
数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx_第1页
第1页 / 共10页
数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx_第2页
第2页 / 共10页
数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx_第3页
第3页 / 共10页
数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx_第4页
第4页 / 共10页
数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx

《数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx》由会员分享,可在线阅读,更多相关《数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx(10页珍藏版)》请在冰豆网上搜索。

数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1.docx

数据挖掘技术在石油行业中的应用研究和操作实现开题报告完成1

,你所编

开题报告填写要求

1.开题报告作为毕业设计答辩委员会对学生答辩资格审查的依据材料之一。

此报告应在指导教师指导下,由学生在毕业设计工作前期内完成,经指导教师签署意见及所在系审查后生效;

2.开题报告内容必须用按教务处统一设计的电子文档标准格式(可从教务处网页上下载)打印,禁止打印在其它纸上后剪贴,完成后应及时交给指导教师签署意见;

3.学生写文献综述的参考文献应不少于15篇(不包括辞典、手册)。

文中应用参考文献处应标出文献序号,文后“参考文献”的书写,应按照国标GB7714—87《文后参考文献著录规则》的要求书写,不能有随意性;

4.学生的“学号”要写全号(如02011401X02),不能只写最后2位或1位数字;

5.有关年月日等日期的填写,应当按照国标GB/T7408—94《数据元和交换格式、信息交换、日期和时间表示法》规定的要求,一律用阿拉伯数字书写。

如“2004年3月15日”或“2004-03-15”;

6.指导教师意见和所在系意见用黑墨水笔工整书写,不得随便涂改或潦草书写。

 

毕业设计开题报告

1.结合毕业设计情况,根据所查阅的文献资料,撰写文献综述:

文献综述

国外数据挖掘现状

随着KDD在学术界和工业界的影响越来越大,其在研究和应用方面的发展也越来越迅速,尤其是在商业和银行领域的应用,甚至比研究的速度还要快。

国外在KDD概念出现不久就开始了数据挖掘的应用。

在第四届知识发现与数据挖掘国际学术会议上有30多家软件公司展示了他们的数据挖掘软件产品,不少软件已在北美、欧洲等国得到应用。

越来越多的计算机公司开始重视数据挖掘的开发应用,MTTAGroup曾做出这样的评论:

“全球重要的企业、组织会发现,21世纪数据挖掘技术将是他们商业成功与否的至关重要的影响因素”。

IBM和微软都成立了相应的研究中心进行这方面的工作,其中IBM公司还发布了基于标准的数据挖掘技术—IBMDB2智能挖掘器积分服务,可用于个性化的解决方案。

两大统计软件公司SAS和SPSS也推出了各自的数据挖掘工具EnterpriseMiner和clementine。

比较有影响的数据挖掘系统还有SGI公司的SetMiner、Sybase公司的WarehouseStudio、RuleQuestResearch公司的See5、以及CoverStory、EXPLORA、KnowledgeDiscoveryWorkbench、DBMiner、Queset等。

这些数据挖掘商业软件工具不断产生和完善,同时面向领域的数据挖掘技术应用以及数据挖掘系统的开发不断的为各行业提供各种成功的解决方案。

其用户主要集中在大型银行、保险公司、电信公司和销售业。

国内数据挖掘现状

与国外相比,国内对数据挖掘的研究相对较晚,还没有形成整体力量。

1993年国家自然科学基金首次支持对该领域的研究项目。

目前,国内的许多科研单位和高等院校竞相开展知识发现的基础理论及其应用研究,这些单位包括清华大学、中科院计算技术研究所、空军第三研究所、海军装备论证中心等。

其中,北京系统工程研究所对模糊方法在知识发现中的应用进行了较深入的研究,北京大学也在开展对数据立方体代数的研究,华中理工大学、复旦大学、浙江大学、中国科技大学、中科院数学研究所、吉林大学等单位开展了对关联规则开采算法的优化和改造,南京大学和上海交通大学等单位探讨、研究了非结构化数据的知识发现以及WEB数据挖掘。

国内的数据挖掘商业领域应用还没有完全跟上理论研究的步伐,很多软件公司的软件产品中提及到的数据挖掘技术很大程度上都是OLAP分析或者是统计分析的功能,并不是真正的数据挖掘产品。

由于国内数据挖掘很大方面集中在数据挖掘某些算法或细节的解决方案,忽略了数据挖掘应用的部署,许多准备实施数据挖掘技术为企业提供解决方案的公司在数据准备、数据挖掘方法、技术以及项目开发上均遇到了一定的障碍。

同时由于没有形成一套完整的数据挖掘项目开发体系以及国内企业数据、体制多特有的一些问题,许多好的理论并不能得到很好的实施。

参考文献:

[1]OliviaParrRud,数据挖掘实践,2003.9

(1),机械工业出版社。

[2]苏新宁,数据挖掘理论与技术,北京:

科学技术出版社,2003.6

[3]安淑芝,数据仓库与数据挖掘,北京:

清华大学出版社,2005.6

[4]陈京民,数据仓库与数据挖掘技术,2002.8

(1),电子工业出版社

[5]JiaweiHanandMichelineKamber,DataMiningConciptsandTechniques,2001.5

(1),HigherEducationPress,P.4-20

[6]朱明,数据挖掘,合肥:

中国科技大学出版社,2002.5

[7]R.Groth著;侯迪,宋擒豹译,数据挖掘:

构筑企业竞争优势,西安:

西安交通大学出版社,2001.8

[8]康塔尼克著;闪四清等译,数据挖掘:

概念、模型、方法和算法,北京:

清华大学出版社,2003

[9]张运涛,龚玲,数据挖掘原理与技术,北京:

电子工业出版社,2004.4

[10]李雄飞,李军著,数据挖掘与知识发现,北京:

高等教育出版社,2003.11

[11]SouKup,T,Davidson,L著;朱建秋,蔡伟杰译,可视化数据挖掘:

数据挖掘可视化和数据挖掘的技术与工具,北京:

电子工业出版社,2004.1

[12]Giudiei,P著:

袁方等译,实用数据挖掘,北京:

电子工业出版社,2004.6

[13]李凯扬,韩文秀,财政收入的组合预测,天津大学学报第36卷第1期,2003.1

[14]谢乃明,刘思峰,离散GM(1,1)模型与灰色预测模型建模机理,系统工程理论与实践,2005.1

[15]权秩,张勇传,组合预测方法中的权重算法及应用,理论视野,2006(5)

[16]Berry,Linoff著;袁卫等译,数据挖掘,北京:

中国劳动社会保障出版社,2004.10

[17]慕红宇,熊金明,基于数据仓库的数据挖掘技术,绍兴文理学院学报,2002.3

[18]史忠植,知识发现,北京:

清华大学出版社,2002

[19]朱明,数据挖掘,中国科学技术出版社,2002

[20]行小帅,焦李成,数据挖掘的聚类方法,电路与系统学报,2003.2

毕业设计开题报告

2.本课题要研究或解决的问题和拟采用的研究手段(途径):

2.1研究背景

自八十年代以来,人工智能转入实际应用,并提出了一个新兴的、面向商业应用的研究课题——数据挖掘。

目前越来越多的管理人员正在利用数据挖掘工具,解决所遇到的至关重要的商业问题和决策问题,如企业经营方向的定位、管理模式的确立、营销的决策、内部生产力的促进、成本的控制和企业核心竞争力的获等。

二十世纪九十年代,我国石油企业内部资金管理组织模式是以广泛分权为基础的多级核算组织模式。

这种企业财权的广泛下放,虽然对调动下属企业生产积极性起到了一定的作用,但是却给企业整体的资金管理工作带来了巨大负面影响。

二十世纪九十年代中后期,中国石油开展了一些关于资金管理机制改革的有益尝试,特别是针对资金管理分散,成立结算中心和财务公司,取得了相当成效,也为以后建立新型资金管理模式积累了一定经验。

中国石油经历1998年国内石油、石化行业大重组,股份公司于1999年成立,2000年在香港、纽约成功上市,目标就是建立现代企业制度,实行规范的公司制改革,把中国石油建成规范化、国际化的大型综合石油公司。

借鉴国际大型石油公司财务管理经验,根据实践经验认识和战略发展要求,股份公司设计了财务运行管理体制的总体框架:

实施全面预算管理,实行资金、债务、会计核算三个集中,以实现财务管理的统一、规范、高效运行。

其中资金管理目标模式是:

实现资金全额集中,收支两条线,所有的销售收入全部集中到总部,地区公司所需的各种形式的资金支出全部由总部按计划下拨。

随着收支两条线的开展和资金管理工作的迅速加强,随之而来的就是总部和地区公司的工作量大幅度增加,工作的复杂程度以及对结果和质量的要求越来越高。

2004年,总部资金业务量达到7.58万笔、资金业务凭证4.72万张;到2005年,仅1到8月份,资金业务量就达到了8.73万笔,资金业务凭证4.36万张;2005年月均资金业务凭证量比实行收支两条线以前的2002年增长了355%。

地区公司工作量的增长幅度也非常大。

为减少重复性手工劳动,提高工作的质量和效率,把资金管理人员从繁琐的简单劳动中解脱出来投身于更高层次的管理工作,我们开发了资金管理分析系统,同时为了给管理者提供更好的决策支持,我们在资金管理分析系统中引入了数据挖掘等先进的管理理论和方法。

2.2数据挖掘的发展趋势

1网站的数据挖掘

随着web技术的发展,电子商务、电子政务等网站风气云涌。

如何吸引客户、建立客户的忠诚度是开展电子商务和电子政务必须面对的问题。

而网站的数据量非常大,并且与传统数据格式不同,大部分数据来源于单击数据流,因此网站的数据挖掘的重点是数据准备。

目前,很多厂商正在致力于开发专门应用网站数据挖掘软件。

2生物信息或基因的数据挖掘

基因的组合千变万化,患某种病的人的基因和正常人的基因到底差别多大?

能否找出其中不同的地方,进而对其不同之处加以改变,使之成为正常基因?

这些都需要数据挖掘技术的支持。

对于生物信息或基因的数据挖掘和通常的数据挖掘相比,在数据的复杂程度、数据量、还有分析和建立模型的算法都要复杂得多。

从分析算法上讲,更需要一些新的和好的算法。

现在很多厂商正在致力于这方面的研究。

3文本的数据挖掘

无论是在数据挖掘还是在分析处理方法方面,文本数据挖掘和前面谈到的数据挖掘相差很大。

文本数据挖掘并不是一件容易的事情,尤其是在分析方法方面,还有很多需要研究的专题。

但文本数据挖掘可以大大扩大数据挖掘的应用领域,因为许多非格式化的数据都比较容易转换成文本数据。

如现在许多大公司都设立客户服务中心,如果把同客户的谈话转化成文本数据,在对这些数据进行挖掘,进而了解客户对服务的满意程度和客户的需求以及客户之间的相互关系等信息,将对公司的业务发展起到推动作用。

随着计算机计算能力的发展和业务复杂性的提高,数据的类型会越来越多,越来越复杂,数据挖掘将发挥越来越大的作用。

2.3主要工作及论文内容

 随着石油勘探开发的不断深入,要想从海量的地震数据中创造新的效益,有必要将数据挖掘方法应用于石油勘探和开发中,以获取高性能的地质、油藏、储层及流体性质评价的预测模型。

该方法由特征选择、模型参数优化、性能评估等三大循环组成,核心技术是将遗传算法用于特征选择和参数优化,通过重复交叉验证得到泛化准确率的无偏估计以及从多种学习方法中优选出最终模型。

本文以克拉玛依油田砾岩油藏水淹层评价为例,研究了6种特征子集方案和决策树、神经网络、支持向量机、贝叶斯网络及组合学习等5种方法,综合考虑预测模型的准确率和生成规则的可操作性,并选择决策树模型作为砾岩油藏水淹级别评价的最终预测模型。

与传统的地球物理勘探方法相比较,采用该数据挖掘方法的优势在于:

可以充分利用多专业数据;获得丰富的预测模型;探查和发现规律;提高预测准确度,因而能更好地为油气勘探开发服务。

本文重点研究了数据挖掘的原理和技术手段,以及其在中国石油天然气股份有限公司的应用。

首先,文章对数据挖掘的基本知识进行了介绍,描述了数据挖掘的研究内容、功能以及数据挖掘的过程模型。

并介绍了一些常用的数据挖掘工具。

其次,文章对中国石油天然气股份有限公司资金管理分析系统进行了简单的介绍。

包括了实施资金管理分析系统的背景以及资金管理分析系统的各个模块的基本功能。

最后,文章具体介绍了数据挖掘在资金管理分析系统中的应用案例。

具体包括:

1介绍了聚类分析在票据管理分析系统中的应用,运用聚类分析对各个地区公司进行聚类,对那些信用度较低的地区公司提出预警,以此来规避资金运行的风险。

2介绍了时序演变分析在资金计划中的应用,首先运用灰色预测、指数平滑和灰色马尔科夫预测等时序演变分析的方法对资金运行状况进行预测分析,而后为了提高预测的精度,本文最终采用了组合预测的方法对资金运行进行预测分析,并展示了预测分析的各种图表。

2.3.1数据挖掘的研究内容

数据挖掘与传统的数据分析(如查询、统计报表、联机应用分析)有着本质区别,数据挖掘是在没有明确假设的前提下去发现知识、挖掘信息,所得到的往往是隐藏在大量信息之中的、预先未知、甚至是违背直觉的知识和信息。

数据挖掘的主要研究内容有以下几个方面:

1异构数据挖掘

异构数据挖掘是指在不同结构的数据环境中挖掘知识的过程。

不同结构的数据环境是指数据库的数据结构是异构的或数据库系统是不同的,甚至数据库系统的运行平台也不统一。

对异构化的数据进行挖掘主要涉及到两个方面:

一是异构数据资源的整合与集成;二是对整合后的数据分析处理。

异构数据挖掘中整合与集成的目的是将分散在各地的、不同结构的、不同数据库系统的主题相关的数据库中数据集成起来.经过清洗整理,加工成一个可供挖掘的数据资源,其典型形式是数据仓库。

异构数据挖掘的数据分析处理实际上就是对数据仓库的知识发现,它包括:

支持各类主题查询和各类复杂的统计分析;联机分析处理;寻找数据仓库中隐藏的模式与关联,构造分析模型;提供可视化的挖掘成果。

2WEB数据挖掘

web数据挖掘是指从众多web网站、网页上挖掘出有用数据和知识的过程。

它的具体研究内容包括:

Web资源的获取;各站点Web数据的汇集;对不同结构的Web数据集成与组织;构造挖掘模型。

通过这样几个阶段最终获取有用的知识。

可以把web中的信息看作是一个巨大的、复杂的、分布式数据库,每一个站点都是一个独立的数据源,它们之间的数据组织形式与结构是不相同的。

因此web上的信息完全可视为是一个异构的数据库环境。

所以对这些数据进行挖掘首先解决站点之间异构数据的集成问题,为用户提供一个统一的视角来看待web资源;其次,对于集成的web数据至少应提供两个方面的挖掘功能:

网络信息与数据的查询;web数据的分析处理和知识发现。

Web是一个海量信息源,对于某一项应用或某一个人来说、面对着大量无用或“垃圾”信息,只有极少部分是有用的。

因此,web数据挖掘已成为当前研究的重点。

由于web数据除了相互间异构外,大量的数据还是半结构、无结构的文本和多媒体信息,所以面向web的数据挖掘远比在关系数据库或数据仓库的数据挖掘要复杂得多,这是一个极具挑战性的研究领域。

目前迫切要解决的是构造—个模型(标准)来清晰地描述Web资源,开发适合Web资源的数据挖掘功能。

3数据挖掘算法的研究

数据挖掘是一个新的研究领域,它主要将传统的信息检索技术上升到从大量数据中发现知识的过程。

由于数据挖掘面对的数据结构是复杂的、数据类型是多样化的、数据规模是巨大的,所解决的问题以及结果形式也是多种多样的。

因此,为了满足数据、问题、结果形式的要求,针对不同的挖掘目的,必须运用不同的数据挖掘算法。

出于用户的挖掘要求总是在不断变化的,其挖掘算法必须适应这种变化要求。

所以,挖掘算法的研究已成为数据挖掘领域中的最重要的研究方面。

主要算法研究体现在这样几个方面:

第一,事物间关联分析的算法研究,要研究各类事物的关联规则,设计能适应不同规则的关联分析算法;第二,数据和信息分类的研究.应强调分类结果的科学合理,有较强的适应性以及分类结果的准确性;第三,数据的聚类分析研究,要保证相近的数据或信息能够聚集在一起,使聚类结果精确可靠,具有实用性;第四,要研究复杂类型数据的挖掘算法,不应局限在文本类型,还须注意不断增加的多媒体信息的挖掘研究。

如时序数据、空间数据、图像数据、视频信息、web信息的挖掘等。

总之,算法的研究是数据挖掘的核心,必须强凋科学性与实用性,在实践中不断优化。

数据挖掘是一种“数据驱动”的解决方法,即不需要事先完全理解岩石物理机理、储层性质变化规律、油藏动态变化特征等,只需少量的背景知识,直接从数据中建立模型,由专家对模型进行分析和解释后再应用于实际,就能取得满意的解释成功率。

目前数据挖掘方法在其他(金融、银行、电信、保险、交通等)领域已经获得广泛应用并为这些行业提供了很好的产业效益,但在国内外石油勘探开发领域中的应用还处于起步阶段,如何实现向勘探数据要构造、要圈闭、要储量、要产量应成为下步数据挖掘方法应用的主要任务。

因此,一方面要加强岩石物理实验研究,完善和优化数据挖掘预测模型和实验模型的相关性标定,分析建模方法中数据、特征、算法、参数及评估等多方面的影响因素,提高实际应用模型的准确率和可操作性;另一方面着力开发数据挖掘软件,并与现有的石油勘探开发数据库、地质评价、测井解释、油藏模拟等软件集成,不断充实算法库,从而能在面对各种复杂问题时,快速给出最佳模型。

参考文献:

【1】张景涛;基于多智能主体的炼化企业ERP系统应用研究[D];天津大学;2004年

【2】石丽,佟贺,李洪凯,李坚;供电预测数据仓库的建设[J];电力系统自动化;2003年13期

【3】朱六璋,袁林,黄太贵;短期负荷预测的实用数据挖掘模型[J];电力系统自动化;2004年03期

【4】李秋丹,迟忠先,金妮,魏巍,董绍彤;基于数据仓库的地区电网调度决策支持系统[J];电力系统自动化;2004年12期

【5】朱六璋;;短期负荷预测的组合数据挖掘算法[J];电力系统自动化;2006年14期

【6】麻秀范,张粒子;基于数据仓库的经济活动分析决策支持系统[J];电力自动化设备;2002年12期

【7】刘宇,栗然;数据仓库技术在发电厂中的应用研究[J];电力自动化设备;2004年09期

【8】许允之,宗剑;变电设备管理信息与决策支持系统[J];高电压技术;2005年06期

【9】刘涌,侯志俭,蒋传文;数据仓库技术在配网自动化中的应用[J];华东电力;2005年01期

【10】钱开余;孙发国;许平;;数据仓库聚集优化在电力决策支持系统中的应用构想[J];江苏电机工程;2006年04期

【11】夏火松!

经管学院;基于数据挖掘技术的市场营销智能决策支持系统的研究[J];武汉科技学院学报;1999年04期

【12】吴慧香;;数据挖掘在财务风险预警系统中的应用[J];财会通讯(综合版);2008年02期

【13】廖里,余英泽,吴渝,聂能;数据挖掘和数据仓库及其在电信业中的应用[J];重庆邮电学院学报(自然科学版);2000年04期

【14】王扶东,朱云龙,薛劲松,李兵;基于数据挖掘的客户关系分析评价系统[J];东南大学学报(哲学社会科学版);2002年S2期

 

毕业设计开题报告

指导教师意见:

 

指导教师:

年月日

所在系审查意见:

 

系主任:

年月日

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 互联网

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1