基于分析客户购买商品的发展趋势的商店数据仓库.doc
《基于分析客户购买商品的发展趋势的商店数据仓库.doc》由会员分享,可在线阅读,更多相关《基于分析客户购买商品的发展趋势的商店数据仓库.doc(13页珍藏版)》请在冰豆网上搜索。
基于分析客户购买商品的发展趋势的商店数据仓库
郑磊2220092079
1问题描述
如果为某商店创建一个数据仓库,主要是通过关于客户的人口统计(收入、家庭人口、家庭位置、爱好,等等),分析客户购买商品的发展趋势,目的是将商店特定的产品推销给合适的潜在客户群。
这个数据仓库应该从哪些地方获取数据源?
数据仓库的体系结构应该包含哪些部分?
如何组织数据?
需要哪些元数据?
请采用星型模型,为购买商品趋势分析设计一个数据仓库,并给出主题的详细描述以及维表的层次结构。
2数据源的获取
2.1数据源
数据源是数据仓库系统的基础,是整个系统的数据源泉。
通常包括企业内部信息和外部信息。
内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。
外部信息包括各类法律法规、市场信息和竞争对手的信息等等。
基于分析客户购买商品的发展趋势的商店数据仓库的运营一般以采购、销售、客户信息管理和商店管理为核心。
围绕着这四个核心部分,数据仓库要提供完整的信息以支持这样一些业务模块:
销售、采购、库存、促销分析、应付账款分析、财务报表、客户信息分析。
数据仓库的核心数据是商品数据信息、客户数据信息、销售数据信息、库存数据信息、人事资源数据信息、财务数据信息和外部数据信息。
而对这些数据的来源极为数据源。
2.2数据源信息的获取
那此基于分析客户购买商品的发展趋势的商店数据仓库应该从哪些地方获取数据源呢?
接下来我们做具体分析。
1商品数据的获取
商品主数据定义了商品的代码、中英文名称、包装、尺寸、颜色、供应商、当前价格、成本、信息,它们是数据分析的基础。
商品信息的获取可以在该商店的商品数据库中获取或在商品的条形码上获取。
2客户数据的获取
客户主数据定义了客户的身份证号、姓名、出生年月、性别、婚姻状况、收入、家庭人口、家庭住址、爱好。
通过对客户信息的记录以分析客户购买商品的发展趋势,达到将商店特定的产品推销给合适的潜在客户群的目的。
客户信息的获取途径为:
1)通过会员卡信息获取;
2)商店工作人员对敏感客户信息的调查;
3)通过信用卡信息获取;
4)调查问卷方式获取。
3销售数据的获取
销售分析和预测是销售业的经营决策中最为重要的部分,因此销售数据是整个商店数据仓库的核心数据之一,同时由于商品种类繁多,交易量庞大,使得销售数据成为数据仓库中数据量最大的部分。
销售数据定义了商店、季节时间、地区、数量、金额、销售空间占用量、类型。
销售数据来源于商店的收银机系统(POS)。
在商店,收银员在收银机上扫描商品条码,系统会自动查询商品价格、名称和折扣信息,并在交易的最后进行结算,产生交易记录。
由于销售的数据量庞大,在一般交易处理系统中很难存放这样庞大的数据,因为这会占据大量的磁盘空间并严重影响系统的运行效率。
即使在数据仓库中,为了针对不同的用户需求,提高心痛性能,销售数据应该存放于多个细节级,供不同的用户使用。
早期细节级:
来自商店POS系统的原始交易明细。
当前细节级:
来自集中存放的每家店、每个商品、每天的销售数据。
轻度综合级:
来自
(1)每个商品每周的销售数据。
(2)每个商品每月的销售数据。
(3)每个商品每年的销售数据。
高度综合级:
来自
(1)每个商品分类每天的销售数据。
(2)每个商品分类每月的销售数据。
(3)每个商品分类每年的销售数据。
4库存数据的获取
库存数据是对许多业务活动进行分析的基础。
比如,用户作销售分析时,就必须参考库存信息,当发现某种商品销售很低或是没有销售时,并不一定是由于需求不足或商品本身的问题,有时是由于补货不及时造成的库存过低引起的。
库存信息定义了商品的种类、库存数量、入库日期、库存地点、出库日期。
库存信息的获取途径为:
1)商店工作人员调查记录
2)由计算机销售系统获取
与销售数据一样,库存数据一样应分为多个细节级,对数据需求不同的用户,提高系统系能。
早期细节级:
来自商店的库存变动明细。
当前细节级:
来自每家商店每个商品的库存。
轻度综合级:
来自:
(1)每个商品每周的库存变动汇总。
(4)每个商品每月的库存变动汇总。
(5)每个商品每年的库存变动汇总。
高度综合级:
来自:
(1)每个商品分类每天的库存变动汇总。
(4)每个商品分类每月的库存变动汇总。
(5)每个商品分类每年的库存变动汇总。
5人事资源数据的获取
人事资源数据包括收银员信息、服务员信息、店长信息、人员管理经理信息、进货经理信息、库存经理信息。
其数据来自于:
1)入职人员信息表
2)入职人员信息档案
3)入职人员省份证复印件
6财务数据的获取
财务数据包括商品名称、商品销售单价、商品进货单价、商品进货总价、商品销售总额、商品盈利总额、商店日盈利额、商店周盈利额、商店月盈利额、商店年盈利额。
财务数据来自于:
1)收银机系统(POS)
2)计算机财务统计系统
7外部数据的获取
外部数据区别与前四种数据,是指不为商店所操作、所拥有、所控制的数据。
这些数据的获取途径为:
1)市场调查记录;
2)计算机系统记录;
3)监管部门信息统计。
3数据仓库的体系结构
3.1数据仓库体系结构简介
数据仓库体系结构建立在其概念结构基础之上,并根据不同应用情况可以选择虚拟数据仓库结构、数据集市结构、单一数据仓库结构和分布式数据仓库结构。
从数据仓库的概念结构看,数据仓库包括:
数据源,数据准备区,数据仓库数据库,数据集市/知识挖掘库及各种管理工具和应用工具。
虚拟数据仓库结构的数据仓库投资较小,数据仓库并没有建立新的数据仓库系统,而是尽可能的利用原有的数据库,大多数操作由原系统完成,数据仓库只是将查询结果概括后提供给用户。
数据集市结构或称为主题结构的数据仓库是按照主题进行构思所形成的数据仓库,它没有独立的数据仓库。
这种体系结构具有相当大的优越性,在完成整体的数据模型设计,数据抽取程序设计后,各个数据集市可以独立进行设计,从而加快了数据仓库的开发过程。
单一数据仓库结构将所有的主题都集中到一个大型数据库中的体系结构中。
数据源中数据被按照统一标准抽取到独立的数据仓库中,用户在使用时再根据主题将数据仓库中的数据发布到数据集市中。
分布式数据仓库结构的局部数据仓库主要存储未经转换的细节数据,在全局数据仓库中主要存储经过转化的综合数据
3.2基于分析客户购买商品的发展趋势的商店数据仓库的体系结构
根据3.1对体系结构的分析,下面就概念结构和数据集市结构来设计基于分析客户购买商品的发展趋势的商店数据仓库的体系结构。
1基于分析客户购买商品的发展趋势的商店数据仓库概念结构
数据集市/知识挖掘库
商店数据仓库数据库
商店各类数据信息的获取
商店系统应用工具
客户购买商品系统
数据源
客户
外部数据源
数据集市/知识挖掘库
商店系统应用工具
客户
商店系统管理工具
图1基于分析客户购买商品的发展趋势的商店数据仓库概念结构
2基于分析客户购买商品的发展趋势的商店数据仓库数据集市结构
商店数据仓库查询管理服务器
商店系统数据库
客户
图2基于分析客户购买商品的发展趋势的商店数据仓库数据集市结构
4组织数据
4.1组织数据的总体分析
数据仓库的数据组织方式可分为虚拟存储方式、基于关系表的存储方式和多维数据库存储方式三种。
虚拟存储方式是虚拟数据仓库的数据组织形式。
基于关系表的存储方式是将数据仓库的数据存储在关系型数据库的表结构中,在元数据的管理下完成数据仓库的功能。
多维数据库的组织是直接面向OLAP分析操作的数据组织形式。
对已收获的数据进行组织和分析,并从中提取人们感兴趣的数据的过程即为数据挖掘。
数据挖掘是数据仓库系统信息处理的重要组成部分。
一方面,基于数据仓库的数据挖掘技术能够提高数据仓库的决策支持能力;另一方面,由于数据仓库完成了数据的收集、转换、集成、存储和管理工作,能够为数据挖掘提供完备的数据,有力于发挥和提高数据挖掘的能力。
对于此基于分析客户购买商品的发展趋势的商店数据仓库,其信息系统往往是比较复杂的,为了保证取得的数据有用、准确,并可以在接受的时间内完成转换和存储,必须对收集的数据进行组织、抽取、转换和装载。
商店使用商店管理系统和收银机系统,商店和配送中心以及客户信息的数据会聚集在该数据仓库,此外,客户往往还有一些数据存在自己的PC上,如一些EXCEL文件,这些分散的数据最终要导入到数据仓库。
其逻辑关系可以用下图表示。
客户数据
外部信息
配货信息数据
商店管理系统和POS数据
数据仓库
具体商店相关信息数据(商品、库存、销售)
图3商店数据库数据的逻辑结构
4.2基于分析客户购买商品的发展趋势的商店数据仓库的数据组织
1商品数据组织与处理
由于商店销售的商品会有很多种类,要对这些商品作分析,首先就要作清晰的分类,就要在系统中建立多层的分类体系。
按商品属性分类可分为服装、干货、硬货、生鲜食品等,服装又可以分为男装、女装、童装等。
2客户数据组织与处理
对于客户数据的组织和处理,应该根据客户的性别进行第一层分类,再根据客户住处位置进行第二层分类,然后根据客户婚姻状况进行第三层分类,最后根据客户的爱好进行第四层分类,由此对以分类的客户进行有类别汇总。
3销售数据组织与处理
对于销售明细记录进行汇总,组织数据的过程如下图所示:
每一商品在商店的日销售汇总
每一商品商店的每周销售汇总
每一商品商店的每月销售汇总
商店销售交易明细
汇总汇总汇总
汇总汇总汇总
每一分类在商店的月销售汇总
每一分类在商店的周销售汇总
每一分类在商店的日销售汇总
图4销售明细记录汇总组织数据过程图
4库存数据组织与处理
库存数据和商品数据的组织处理过程大体相同,即:
对库存商品作分析,首先就要作清晰的分类,就要在系统中建立多层的分类体系。
按商品属性分类可分为服装、干货、硬货、生鲜食品等,服装又可以分为男装、女装、童装等。
此外,着重观注商品剩余数量这一信息,对库存量低于50的商品汇总以进货,避免供不应求。
5人事资源数据组织与管理
人事资源数据的组织与处理,首先应该对工作人员按职位进行排列以便方便提取信息及信息的管理,然后按性别进行排列,以便管理。
6财务数据组织和管理
财务数据的管理应该对日收入金额、周收入金额和月销售金额、季度销售金额、年销售金额进行精确统计,以便对盈利等方面的统计打下好的基础。
5元数据
销售主体元数据
名称
Sales
描述
整个商店每个POS机所记载的商品销售状况
目的
用于进行商店销售状况和促销情况的分析
联系人
各个门市销售经理
维
时间、商品、客户、商店、促销
事实表
销售事实表
度量值
销售成本、