数据挖掘技术在电信计费系统中的应用-论文Word格式.doc

上传人:b****2 文档编号:14180799 上传时间:2022-10-19 格式:DOC 页数:48 大小:631.50KB
下载 相关 举报
数据挖掘技术在电信计费系统中的应用-论文Word格式.doc_第1页
第1页 / 共48页
数据挖掘技术在电信计费系统中的应用-论文Word格式.doc_第2页
第2页 / 共48页
数据挖掘技术在电信计费系统中的应用-论文Word格式.doc_第3页
第3页 / 共48页
数据挖掘技术在电信计费系统中的应用-论文Word格式.doc_第4页
第4页 / 共48页
数据挖掘技术在电信计费系统中的应用-论文Word格式.doc_第5页
第5页 / 共48页
点击查看更多>>
下载资源
资源描述

数据挖掘技术在电信计费系统中的应用-论文Word格式.doc

《数据挖掘技术在电信计费系统中的应用-论文Word格式.doc》由会员分享,可在线阅读,更多相关《数据挖掘技术在电信计费系统中的应用-论文Word格式.doc(48页珍藏版)》请在冰豆网上搜索。

数据挖掘技术在电信计费系统中的应用-论文Word格式.doc

ABSTRACT

Withtherapiddevelopmentofthenetwork,somelargecompaniessuchasChinaTelecomlaunchedtheserverrentbusiness.Inordertostatisticuserlogininformationandchargemorefastly,convenientlyandefficiently,aTelecomtollsystemisdevelopedinthispaper.

ThissystemisprogrammedbyC++languagewithC/SarchitectureinUnixoperatersystem.Thefunctionsinclientportincludereadinguserinformationfromunstructurallogfile,matchingdataandsendingdatatoaserver;

Thefunctionsinseverportincludereceivingdatafromclient,datastorageandintegratingdata.DataminingtechnologyisusedinthehugeamountofdatamatchingprocessingandalltheresultfuldataareallstoredinOracledatabase.

Keywords:

theTelecomtollsystem;

Datamining;

Datamatching;

Dataintegration

目  录

1引言 1

1.1 课题来源及意义 1

1.2 国内外发展状况 1

1.2.1数据挖掘技术的基本知识 1

1.2.2 数据挖掘技术的基本应用 2

1.2.3 数据挖掘技术的发展 2

1.3本文的主要工作 2

1.3.1 设计思想和实现目标 2

1.3.2 论文结构安排 3

2系统分析 3

2.1可行性研究 4

2.1.1技术可行性 4

2.1.2 经济可行性 4

2.2  需求分析 4

2.2.1 项目业务需求 4

2.2.2 功能模块 5

2.2.3 用例描述 7

3 概要设计 13

3.1业务流程 13

3.1.1业务流程中几个存储文件的命名规则 13

3.1.2业务规则说明 13

3.2系统模块 13

3.3接口设计 15

3.3.1用户接口 15

3.3.2外部接口 15

3.3.3内部接口 16

3.4数据结构设计 16

3.4.1登入/登出记录数据类 17

3.4.2匹配的用户登录记录类 17

3.5数据库设计 18

4详细设计和实现 20

4.1客户端模块 20

4.1.1数据读取模块设计 20

4.1.2数据匹配模块设计 23

4.1.3数据发送模块设计 27

4.2服务端模块 31

4.2.1 数据接收模块设计 33

4.2.2 数据存储模块设计 36

4.2.3 数据缓冲池 38

4.3 异常设计 39

4.3.1 异常类结构图 39

4.3.2 客户端异常类说明 39

4.4 数据库具体实现 40

5结论 42

参考文献 43

致  谢 44

2012届本科生毕业论文(设计)

1引言

1.1 课题来源及意义

随着计算机及互联网技术的高速发展,一些大的厂家例如电信,推出了服务器出租这项业务,选择这项业务的用户可以通过远程登录服务器上进行自己的工作。

服务器出租就是指用户不需要自己购买服务器,只需要根据自己的业务要求,向运营商申请一个帐号通过远程登录,便可以轻松享用服务器。

由于服务器的价格相当昂贵,所以更多的用户更倾向于选择租用,而不是购买。

这样服务器出租便得到了广泛的发展。

这时就需要一款运行在服务器上的计时软件,来统计用户的使用情况来做出相应的收费依据。

在此背景下,电信计费系统便应运而生了,电信计费系统是专门为服务器租赁商开发研究的,租赁商只需要在各地区出租的服务器上安装本系统,就会有相应的数据从客户端源源不断发送到服务端,这样便可以轻松的了解各地服务器的运营状况,以及盈亏情况,同时也可以作为用户缴纳费用的依据。

电信计费系统是专门为电信制作的一款计费程序,可以非常方便、快捷、实时查询出用户需要缴纳的费用。

方便运营商在后续阶段进行合理的计划调整。

通过对这一课题的学习和研究,可以将电信计费系统的基本原理、实现流程等展现出来,并可作为新的综合电信计费系统来学习和研究,也可以顺带了解实际电信实时计费的工作流程,具有一定的现实意义。

1.2 国内外发展状况

由于用户数量巨大,所有用户信息交错保存在非结构型日志文件中。

如何从海量数据中找到某一用户的计费信息,就需要数据挖掘技术的支持。

1.2.1数据挖掘技术的基本知识

数据挖掘(DataMining,简称DM),又称为数据库中知识发现(KnowledgeDiscoveryfromDatabase,简称KDD),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程[1]。

整个知识挖掘(KDD)过程是由若干挖掘步骤组成,而数据挖掘仅是其中的一个主要步骤。

尽管数据挖掘仅仅是整个知识挖掘过程中的一个重要步骤,但由于目前工业界、媒体、数据库研究领域中,“数据挖掘”一词已被广泛使用并被普遍接受,因此也可以广义地使用“数据挖掘”一词来表示整个知识挖掘过程,即数据挖掘就是一个从数据库、数据仓库或其它信息资源库的大量数据中发掘出有趣的知识。

1.2.2 数据挖掘技术的基本应用

实际上数据挖掘技术从一开始就是面向应用的。

目前,在很多重要的领域,数据挖掘都可以发挥积极促进的作用。

尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业应用领域。

数据挖掘能够帮助解决许多典型的商业问题,其中包括:

数据库营销、客户群体划分、背景分析、交叉销售等市场分析行为,以及客户流失性分析、客户信用评分、欺诈发现等等。

1.2.3 数据挖掘技术的发展

数据挖掘的目的就是为企业决策提供的正确依据,利用计算机及信息技术辅助完成从分析数据、发现问题、作出决策到采取行动这一系列操作。

因此人们将这种机构行为和手段称这为“事务智能”(BusinessIntelligent,简称BI),BI能极大地改进决策的质量和及时性,从而改进机构的生产率或发挥竞争优势。

所以近年来,一些大公司将数据分析和数据挖掘工具及其有关技术组合起来形成所谓BIS(BusinessIntelligentSoftwave)。

其中SAS公司的的EnterpriseMinter就是将数据源、数据预处理、数据存贮、数据分析与发掘、信息表示与应用等方面技术有机形成一个复杂数据挖掘系统有机整体。

1.3本文的主要工作

1.3.1 设计思想和实现目标

设计思想是:

任何用户登录Unix系统,Unix系统都会记录用户的登录信息,所有用户登入/登出的信息都保存在Unix的系统日志文件中。

数据采集系统就是通过读取Unix系统日志文件中用户登入/登出信息,并找出成对的登入/登出记录,得到用户登录服务器的登入时刻、登出时刻、登录时间长度等电信用户收费需要使用的数据。

实现目标是:

把匹配处理好的数据保存成电信工作人员可以阅读的文本文件,做为电信收费依据。

1.3.2 论文结构安排

本文的结构安排如下:

第一章引言

介绍了课题的概况和相关技术的发展情况,以及课题的设计思想和实现目标。

第二章系统分析

介绍了项目中涉及到的各种数据信息,各个功能模块的运行流程。

第三章概要设计

概要设计文档主要描述了数据挖掘系统的总体设计,从上述文档中明确DMS系统需求的基础,从而划分出DMS系统的几大功能,进行系统开发分工,明确各模块之间的接口,为进行后面的详细设计和实现做好准备。

第四章详细设计及实现

本章主要介绍了各个模块的具体实现流程图和具体实现代码

第五章结论

回顾并总结了课题的研究过程中所做的工作,也思考了研究过程中遇到的问题并列出了实践中的不足之处,最后根据自己的认识对相关技术的发展前景进行了展望。

2系统分析

2.1需求分析

电信公司现在具有哪些设备环境,能提供哪些原始数据,需要的最终数据形式是什么,数据是什么。

电信公司为客户提供Unix服务器出租的服务,这样就必须有一个程序通过从Unix系统日志文件的海量数据中挖掘出用户登录、登出的时间来计算用户登录时长,并生成数据报表存储在公司另外的一个Oracle数据库中,以便电信公司计算费用。

2.2 功能模块

根据用户需求分析,电信计费系统主要功能模块包括:

数据读取,数据匹配,数据发送,数据接收,数据存储,数据整合。

模块具体活动流程如图2-1:

图2-1  系统活动图

数据读取:

该模块的主要功能是读取UNIX服务器上的的用户登录信息日志文件,备份日志文件,读取上一次未匹配成功的登录记录信息,读取备份的日志文件。

数据匹配:

该模块的主要功能是将数据读取模块读取到的数据按照图一定的关系匹配成完整的数据,未完成的匹配的数据保存在到文件中。

方便下次读取时进行匹配。

数据发送:

该模块的主要功能是建立客户端socket网络连接,将匹配好的用户登录记录发送到服务,未发送成功的记录保存在文件中为下次发送时重新读取。

数据接收:

该模块的主要功能是建立服务端的网络连接,从客户端读取匹配好的用户登录信息放入缓冲池中。

数据存储:

该模块的主要功能是将缓冲池中的数据保存到指定的数据库表中。

数据整合:

该模块的主要功能是将数据库中保存的用户登录记录按照日、月、年整合成详细的报表。

2.3 用例描述

根据用户需求和功能分析,生成系统用例图。

如图2-1所示。

图2-2  系统用例图

电信计费系统各功能模块的用例说明如下:

数据读取用例说明:

保存用户登录信息的UNIX系统日志文件在/var/adm目录下,文件名为wtmpx,日志文件以二进制方式进行存储的,如果想在UNIX下查看wtmpx,可以使用last命令:

last[-a][-nnumber|-number][-ffilename][name|tty]

wtmpx文件中每条记录都包含有372个字节,所包含的每条记录项格式如下表2-1所示(其中灰色背景区域的数据为本系统需要采集的数据项):

表2-1  用户登

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 其它模板

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1