统计分析系统V10设计说明书.docx
《统计分析系统V10设计说明书.docx》由会员分享,可在线阅读,更多相关《统计分析系统V10设计说明书.docx(16页珍藏版)》请在冰豆网上搜索。
统计分析系统V10设计说明书
统计分析系统V1.0
设计说明书
中科软科技股份有限公司
二○二二年三月
第一章前言
一.1编写目的
本文档将描述统计分析系统的总体设计实施方案,该方案将为评估和选择技术产品提供依据,为最终形成一个高度集成的可运行系统奠定基础。
该文档建立在了解保险公司现有信息系统结构的基础上,描述统计分析系统的基本轮廓,对系统的软硬件结构、实施步骤进行了说明。
一.2背景说明
一.3项目范围
一.4读者对象
本文档主要针对系统开发人员,甲方业务及IT人员。
一.5术语和缩写词
名词和缩略语
解释
一.6系统目标
一.6.1建立数据平台
本系统最终将建成数据收集、数据存储、数据利用一体化的数据平台,为统计分析应用以及其它数据应用系统提供数据支持。
一.6.2建立应用平台
建立统计分析系统的应用平台是本项目的另一个重要目标,用来支持未来的各种统计分析数据应用,如承保报表、承保清单、理赔报表等等。
一.6.3建立指标体系
经营管理指标是保险公司用以评估日常经营情况的重要依据。
由于岗位职能、业务目标的不同,使得公司范围内各层次用户分析、管理角度存在差异。
这种差异通常会在公司范围内产生大量的歧义指标和不一致的统计标准。
系统的建立客观上需要跨越各部门的纵向划分,制定全公司统一的经营管理指标体系。
一.7发送对象
本文档将发布给以下人员:
✧保险公司相关人员
✧中科软相关人员
第二章整体规划
二.1总体逻辑架构
中科软建议的统计分析系统整体逻辑架构如上图所示。
整体架构主要由以下几部分组成,即:
数据源,数据导入,数据平台,BI工具,应用平台,统一标准平台。
二.1.1源数据
源数据指目前正在运行的各种业务系统数据和一些外部数据,包括核心业务系统、收付费系统和财务系统等系统的数据。
二.1.2数据导入
主要完成源数据向数据平台的抽取、传输、转换和加载,这个过程也叫ETL处理,需要配备ETL服务器完成数据抽取、转换和加载工作。
由于各源系统业务处理周期和方式的不同,导致各种源数据的更新周期和方式有较大的差异。
数据采集层必须能够适应和满足这些变化和需求,保证数据及时、正确、完整地进入数据库。
二.1.3数据平台
作为统计分析系统的核心,它存储和管理来自各种源数据系统的数据,并为访问用户提供数据服务。
这些数据是按照数据模型分主题进行组织、重构和存放的,包括当前数据和较长期的历史数据。
根据数据的分布和粒度粗细,分为ODS、MID、APP层。
二.1.4BI工具
在数据平台的基础上,通过BI工具可以快速地生成固定格式报表、灵活动态查询、OLAP分析、图形分析等应用。
二.1.5应用平台
提供承保报表、承保清单、理赔清单、信息披露等不同业务应用。
应用功能根据保险公司的经营现状和管理热点逐步的细化和开发。
二.1.6标准平台
标准平台是统计分析应用的基础,包括代码的标准化,维度的标准化,指标的标准化,流程的标准化等。
二.2设计原则
二.2.1整体性-整体规划
统计分析系统中存储着大量的客户基本信息、保单信息、财务信息等,这些对于来说,都是巨大的财富。
系统建成以后,将形成一个统一的数据应用平台,将在全公司范围内使用。
因此,其规划和实施都应该在总公司的统一规划、部署和指导下具体实现,系统的整体性必须得以保证。
二.2.2延续性-分步实施
统计分析系统是为公司经营管理服务的信息系统,随着公司经营管理的逐步细化和管理热点的动态转变,统计分析系统的功能也随之逐步转换和深入,统计分析系统的建设是一个长期复杂的过程,持续时间会很长。
因此在系统的建设过程中,需采用“整体规划、分步实施”的策略,在系统的整体框架下系统开发投产能够分阶段地进行,并保持各阶段工作的连续性和可继承性。
这就要求不论是系统的整体规划、体系结构设计、应用规划还是平台的选择、人员的配备都应考虑到项目的连续性和可持续发展性。
二.2.3高起点、快建设、高回报
将保险行业已经成功实施的成熟的报表数据模型、分发管理、口径管理等体系,经过少量修改,直接应用在的系统中,这样既节省了系统建设成本,又能够快速满足大多数的管理需求。
第三章技术方案
三.1技术架构
统计分析系统的整体技术架构如下:
整个体系架构中主要设计源数据、数据导入、数据存储、数据访问等方面。
三.2源数据
源数据指目前正在运行的各种业务系统数据和一些外部数据,包括核心业务系统、收付费系统和财务系统等系统的数据。
核心业务系统等生产系统对系统的性能要求很高,而统计分析系统的数据访问通常是大量且成本较大的访问,为了保证生产系统的性能与安全,建议在生产系统的基础上建立同步的备份数据库,统计分析系统以备份数据库作为数据源,通过备份数据库将生产库与统计系统进行有效隔离,保证数据的安全性和高性能。
生产数据库
备份数据库
统计数据库
三.3数据导入
主要完成源数据向统计数据平台的抽取、传输、转换和加载,这个过程也叫ETL处理。
数据导入提供对数据的流动和控制的程序及服务,从而将数据装载进统计数据库。
如下图所示:
ETL可以采用自主研发,也可以采用成熟的ETL工具完成。
三.4数据存储
统计分析系统的数据存储不同于操作型的核心业务系统,数据的存贮方式、数据库结构都有所不同。
需要按照业务管理主题对原数据进行重新的整合。
通常的统计分析系统的数据存储模型框架如下:
三.5数据访问
统计分析系统通常的访问方式有以下几种:
联机查询访问、统计报表访问、OLAP访问、操作型访问。
联机查询访问:
例如查询业务清单,明细数据,需要实时访问统计分析数据库。
统计报表访问:
例如查看保费计划情况等统计报表,统计报表通常事先已经生成完毕,具有固定的格式。
OLAP访问:
通过OLAP工具对事先生成的多维分析数据进行动态访问,查找、分析业务问题。
操作型访问:
为完成特定的管理应用,通过操作型功能与统计分析系统进行交互,类似于业务系统,例如准备金评估等。
统计分析系统通常使用前端工具来完成数据的访问工作,已满足高效率和多样性。
三.6用户及权限
统计分析系统的用户及权限管理如下图所示:
每个使用统计分析系统地员工将被赋予一个或多个角色,每个角色将被赋予若干功能权限,这样不同的角色进入统计分析系统将只能看到并使用设置给他的功能。
对于数据管理的权限,将在统计分析系统的内部进行约束,不同机构层级的员工将被约束,例如某中支公司的员工将无法看到其他中支公司的数据。
第四章应用方案
四.1用户角色
用户角色是指使用统计分析系统的人员,分为以下几种类型。
四.1.1岗位
四.1.1.1统计岗
具有统计系统权限的用户。
理赔统计人员可查看理赔相关报表和清单。
承保统计人员可查看承保相关报表和清单。
财务统计人员可查看财务相关报表和清单。
四.2应用举例
以下是建议统计分析系统的部分应用,具体需求还需要在需求分析阶段和业务部门做进一步分析确认。
四.2.1承保报表举例
可通过设置查询条件直接查看。
可导出Excel报表查看:
四.2.2清单报表举例
⏹承保清单
第一步:
选择查询条件
第二步:
查看结果清单
第三步:
可导出到Excel查看
四.2.3理赔报表举例
如下列例子所示:
第五章指标体系建设
统一的指标体系可以消除各个数据使用者之间可能产生的歧义,达到企业范围内的最佳秩序。
中科软科技通过多年来在保险统计分析领域的经验积累,已经拥有一了套完整的统计分析指标体系。
该体系不但经过了保险行业内众多的实际案例的检验,也完全与保监会、保标委等管理机构下发的指标体系兼容,在统计分析系统项目中,可以在中科软科技提供的指标体系的基础上稍作本地化,就可以投入使用,可以大大的缩短指标体系的建设过程。
一下为指标体系中的指标举例:
详细请参加《数据字典》
第六章系统软硬件配置
六.1系统硬件配置
建议的第一期统计分析系统的物理拓扑结构如上图所示。
BI数据库:
存放统计分析数据,为保证不相互影响,需要和业务系统数据库分离。
ETL服务器:
负责ETL,完成数据的抽取、转换和加载。
BI服务器:
负责统计分析报表生成和统计分析应用展示。
在后期应用逐步增加时,为平衡性能,将BI服务器逐渐拆分为:
报表服务器,应用服务器。
六.2系统软件配置
需要的软件配置如下:
六.2.1数据库软件
存储统计分析系统数据。
六.2.2ETL软件
将业务系统等数据源数据经过转换,加载到统计分析数据库中。
六.2.3BI报表软件
生成台帐清单、固定报表、多维分析报表等各种统计分析应用。
六.2.4WEB应用服务器软件
提供统计分析系统的运行环境。
通常为weblogic或websphere或jboss等。
六.2.5系统门户软件
提供统一的访问路径和权限管理。
六.2.6指标体系管理软件
提供指标体系管理、代码集管理。
六.3系统配置推荐清单
1、第三方软件产品一览表
序号
产品名称
推荐配置
数量
1
数据库引擎及其管理软件
ORACLE10g
1
2
BI/OLAP/报表工具软件
Mondrian
1
3
Web应用服务器
BEAWebLogic或jboss
1
1、自有产品一览表
序号
产品名称
推荐配置
数量
1
BI数据模型
SinosoftIDM3.0
1
2
ETL工具
SinoSoftDataIntegrator
1
3
系统门户
SinosoftPortal2.0
1
4
指标体系管理
SinoSoftMetadata
ManagementTool1.0
1
3、硬件产品一览表
序号
硬件名称
厂商
配置简述
数量
1
数据库服务器
IBM
或同类设备
PC服务器:
4CPU,8GBMemory
1
2
ETL服务器
IBM
或同类设备
PC服务器:
2CPU,4GBMemory,
1
3
应用服务器
IBM
或同类设备
PC服务器:
4CPU,8GBMemory,
1
4
数据存储
第一期100G存储空间
100G