基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx

上传人:b****1 文档编号:13262863 上传时间:2022-10-09 格式:DOCX 页数:51 大小:840.46KB
下载 相关 举报
基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx_第1页
第1页 / 共51页
基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx_第2页
第2页 / 共51页
基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx_第3页
第3页 / 共51页
基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx_第4页
第4页 / 共51页
基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx_第5页
第5页 / 共51页
点击查看更多>>
下载资源
资源描述

基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx

《基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx(51页珍藏版)》请在冰豆网上搜索。

基于数据仓库的数据挖掘模型应用方案建议书方案之家Word文档下载推荐.docx

1.2建设原则

根据xxx多年的建设经验和客户的需求。

系统规划和建设的原则主要包含以下几个方面:

1.系统集中、分步实施原则

采用统一原则,建立统一基础模型结构,考虑有多个模型需要建立,根据模型的重要性和紧迫性采用分步实施,先实施主要的几个模型,随后逐步实施其它模型,不仅符合运营商初期现实情况,又有效的保护了投资,使ROI最大化。

2.以客户为中心,以市场为导向

系统需满足个性化、信息化的需求。

围绕以客户为中心吸引客户、方便客户、满足客户,为客户提供多样化及个性化服务,赢得客户满意的理念设计系统,以适应市场不断的变化。

3.接口的标准化和规范化原则

实现系统内部接口的标准化、规范化,并且能够实现与综合营帐、综合客服、专业计费等相关专业系统间接口的标准化、规范化。

系统与外部应用应遵从双向接口,向应用提供模型数据输出以及接受模型评估后的结果进行模型自动修正。

4.具备先进性的同时规避风险

充分利用开发商(xxx)在与其它各大运营商在多年合作中积累的市场、技术、客户体验的经验。

充分利用xxx在深圳联通经营分析系统建设中的沟通与经验的积累。

采用新的实现技术,新的管理理念使系统具备先进性,同时继承其成熟的技术,成熟的理念,有效规避建设风险。

1.3总体要求

1.3.1基本指导思想

1、将数据仓库建设成为全公司、全业务、全产品的统一经营数据分析核心平台;

2、具备公司全业务、全流程的预测、调整、评估能力;

3、具备对各生产作业系统的指挥、调度、评估能力;

4、具备对各环节、各作业单元、各产品较完善的财务损益测算能力;

1.3.2系统定位

 

系统定位为整个公司核心的经营分析、生产决策平台,使用模型生产的结果数据进行有效的营销。

1.3.3功能描述

1.基本内容:

●具备对客户价值、行为、生命周期、信用等方面评分分级功能;

●具备对各营销方案、维系挽留政策财务损益测算功能;

●具备针对不同营销活动进行响应客户识别功能;

2.功能要求 

●具备数据挖掘能力、财务损益测算评估的能力;

●用户界面必须友好、人性化;

●具备方便的模型参数调整功能与界面,可实现参数动态灵活调整,并需要具备参数到期自动提醒功能;

●数据源必须丰富,不仅包含系统性数据源,还要包含计财、市场等管理性外部数据源;

●具备界面友好的模型评估功能;

●具备经营分析数据与文档统一存储功能;

●具备方便的可扩充的外部接口与各应用系统交互;

●具备较好的帮助功能、在线培训功能;

1.4建设目标

本工程建设,考虑到技术、投资、效益、管理等各方面,需要按照指导思想提到的“个别试点、逐步铺开”的原则来开展。

目前,技术上存在效果可行性的进一步核实和论证问题,投资方需要确定投资的规模和风险,项目建成后是否可以取得预期的效果也有不确定性,管理上也需要急迫的见到工程实施后的效果,所以需要将整个工程分成以下几个阶段。

近期目标

中长期目标

“方案论证”“南京、扬州试点”“一类地市”

“二类地市”“三类地市”

具体如何区分地市的类别,可以按照目前省公司的分类方法,也可以选用经济状况划分,分类如下:

以上地市类别是按照各地市的话务收入来划分的。

1.4.1近期目标

近期目标主要,完成“方案论证”,“南京、扬州试点”和“I类地市”的应用。

近期目标这样的安排,对以后规避投资风险,以及总结成功经验有好处,做好“南京、扬州试点”工作后,将使用该项技术及延伸的业务问题解决能力,推广到急需使用的、并且经济条件好的地市。

1.4.2中长期目标

中长期目标,在巩固了近期目标,并进步深化落实近期目标的基础上,总结经验后,向全省各地市铺开,全面建立数据挖掘模型基础,并解决急切的业务难题,实现项目预期的客户信用控制技术基础和应用。

1.5术语解释

DB:

Database数据库,是数据的存储组织方法。

OS:

OperationSysterm操作系统,对硬件设备进行管理和对软件系统进行支撑的平台。

ETL:

Extraction、Transformation、Loading数据抽取、转换、装载系统,该系统整合不同的数据源过来的数据,并对数据进行初步的规格化整理,清洗除杂。

捕获率:

实际上是同一用户被判断为同一用户的人数/实际上是同一用户的总人数。

捕获纯度:

实际上是同一用户被判断为同一用户的人数/所有用户(包括同一用户和不同用户)被判断为同一用户的总人数。

第2章系统平台方案

2.1硬件总体方案

2.1.1基本原则

硬件平台包括硬件和系统软件两个大的方面,同时,网络架构安全性的考虑也是关键的部分。

系统的硬件设计中遵循以下几个基本原则:

●先进性

采用当前世界先进的基于计算机网络的软件、硬件产品,从而保证系统在技术上领先。

计算机产业是发展迅速的产业,新技术不断涌现,旧产品快速淘汰。

选择能够长久发展的主流机种可以减缓机器更换频率,提高主机的服务年限,更好的利用设备投资。

在实用的前提下,应从投资保护及长远观点做适当考虑,在技术上要保持五至十年左右的先进性。

●可靠性

系统应具有极高的运行质量,能够一天24小时连续不断工作。

整个系统应采用多种系统容错手段,主要设备采用高可靠性设计,保证无故障时间满足系统要求。

这就要求从硬件和软件平台的角度,能够提供高可用的解决方案。

高可用方案针对可靠性、可用性、容错能力、最大无故障时间等方面提供完整科学系统方案。

●稳定性

系统必须保证稳定运行。

●可扩展性

软件、硬件平台应具有良好的可扩充、扩展能力,能够方便进行系统升级和更新,以适应各种不同业务的不断发展。

市场竞争越加激烈,为了提高竞争力而不断推出新业务得以满足市场要求。

这就要求系统在技术上具有强大的扩展能力,能够满足业务量的提升,同时能够为增加软件功能提供运行空间。

●安全性

充分考虑了整个系统运行的安全、备份与恢复策略和机制,可以根据不同的业务要求和应用处理,设置不同的安全措施。

系统包括大量的数据,保证这些数据不被恶意破坏、非法侵取是电脑系统安全策略所要解决的内容。

安全、备份与恢复策略提供网络、主机、交易等关键资源有力保护,为业务系统创造安全可信的运作空间。

●经济性

经济性原则要求系统的设计与实施必须考虑现有资源的使用和闲置情况,如存储、网络资源等的利用,尽可能使用最小的投资,完成最可靠的系统。

设计应充分保护目前的设备投资并将再投资规模控制在较合理的范围之内,保证系统的建设具有很好的投资回报效应。

同时系统应该还具有较低的运行和维护费用。

●高性能

平台应用具有强大而平衡的处理能力。

针对系统数据量大,数据格式复杂,业务比数繁多等情况,要求服务器能够支持大规模批量处理,尤其在高峰期间能够与磁盘系统配合,使整个系统性能平衡不会出现系统瓶颈,保证系统响应大压力的数据负载。

2.1.2网络拓扑图及说明

整个系统具有以下特点:

●存储系统采用SAN网络,有利于系统存储的扩展。

●数据库服务器配置1台,应用服务器使用1台,两台服务器做成双机互备,保证了高可用性。

●可以采用IP映射的方式,将IP映射到firewall的DMZ区,保证系统的安全性。

●内网与外网之间通过防火墙隔离,保证内网的安全,必要时可以采用IDS系统对系统进行入侵检测。

●与其他系统数据传送通过firewall设备进行安全控制,这样可以避免对其他系统安全带来威胁。

●前端可以通过专网或者Internet接入,接入可以多样性。

网络拓扑结构图如下:

2.1.3硬件平台组成及功能

系统的硬件平台主要有以下设备组成:

●数据库服务器

数据库服务器是系统数据处理的中心。

通常把数据库服务器称为主机系统。

支撑主机系统的核心系统软件是数据库支撑软件,采用Oracle10gR2EnterpriseEdition。

挖掘服务器是数据模型算法中心,用在系统中用来对数据进行分析和挖掘。

本系统的建设将系统的数据挖掘服务器与数据库服务器物理上采用同一台主机,采用InsightfulMiner挖掘支撑工具。

●应用服务器

应用服务器是系统业务逻辑的核心,承担着前端用户的访问。

●磁盘存储系统

存储系统实际上包括联机存储和脱机存储两部分,磁盘阵列就是我们通常所说的联机存储。

这部分也包括硬件和软件两块,硬件包括SAN交换机和磁盘阵列。

●网络设备

网络设备主要包括核心交换机、接入交换机、路由器等各种保证网络互联互通的设备。

建议方案采用与营帐等其他系统共用方式,节省投资。

●网络安全设备

防火墙是在网络层保证系统安全的重要组成部分,它可以防止恶意攻击,也可以防止非法入侵。

同时还具有网络隔离的功能,是保证系统安全的最核心、最有效部分。

2.2硬件配置依据

2.2.1性能问题分析

首先,必须有适当的硬件体系结构,要优化网络和CPU的效用,如果要最充分的利用网络和CPU资源,则数据的布局将是很重要的。

在为取得性能进行数据布局时,数据的布局会受到很多因素的影响,包括规模、数据的易变性、复制、数据的访问频率以及其他因素。

其次,要有良好的数据库结构设计。

如果数据库设计得不合适,不仅不能充分发挥最大作用,而且应用程序的性能则会受到影响。

本系统是一个面向业务的系统,因此,如何提高效率、响应速度,是业务每一个环节都必需考虑的问题。

2.2.2数据挖掘系统磁盘存储容量计算

按50万的用户规模计算存储容量。

下面将对这部分的容量进行详细计算:

数据种类

每用户字节数

用户数量

保存时间

数据量(GB)

(Kb)

(万)

(月)

客户资料有关

2

50

1

0.95

客户消费数据

6

2.86

客户信用度模型

3

1.43

客户流失模型

行为细分模型(6个)

生命周期识别模型

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 语文

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1