某地税数据仓库需求说明书.docx
《某地税数据仓库需求说明书.docx》由会员分享,可在线阅读,更多相关《某地税数据仓库需求说明书.docx(78页珍藏版)》请在冰豆网上搜索。
某地税数据仓库需求说明书
XX地税项目
数据仓库迁移升级需求说明书
第一章系统功能概述
下面将从系统的建设目标、数据模型、语义层建设、指标及固定报表范围、需求匹配等方面对数据仓库迁移改造进行概要说明。
一.1系统建设目标
数据仓库迁移改造为了将原数据仓库数据迁移到新设备上,同时将数据库从db2迁移到oracle。
由于原数据仓库建立时间较长,数据模型及应用已经老化。
因此,迁移同时对原数据仓库进行模型及应用的改造,使用工具重新进行抽取开发。
数据仓库迁移升级后,可以规范查询分析语义层;提高查询效率;彻底解决固定报表速度问题。
建立数据仓库应用平台,权限统一管理,同时便于今后应用扩展。
一.2迁移升级功能构成
系统功能结构如上图所示,按照功能特点将其划分为数据模型、语义层、分析报表、固定报表及指标。
由于原数据仓库内容较多,本次迁移升级以数据模型改造、抽取改造及迁移为基础,对部分分析和固定报表进行改造和迁移。
第二章数据模型
二.1事实表
二.1.1功能描述
该模型用于将业务数据库数据表用数据仓库方式转换、抽取。
可采用星型或其他构建模型。
确定抽取粒度、周期、范围。
建立脏数据清理规则、记录规则及处理规则。
二.1.2操作权限
数据模型无权限要求。
二.1.3模型内容
事实表分为以下结构
二.1.3.1税源管理
v
序号
类别
名称
模型要求
数据表
1
税源管理
纳税人基本信息
包含所有纳税人基本信息,以业务数据库纳税人信息三张基本表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_DW_TAXPAYER
2
企业纳税人信息
包含所有纳税人基本信息,以业务数据库纳税人信息三张基本表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_COMPANY
3
合伙人信息表
包含合伙人信息表,以自然人登记信息表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_PARTNER
4
分支机构表
包含分支机构信息,以业务数据库纳税人信息三张基本表和分支机构为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_BRANCHORGAN
5
残疾人信息表
包含残疾人信息,以业务数据库纳税人信息三张基本表和残疾人信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_HANDICAPPED
6
投资方信息表
包含投资方信息,以业务数据库纳税人信息三张基本表和投资方信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_CAPITALFORM
7
纳税户开户行信息表
以业务数据库纳税户开户信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_ACCOUNT
8
车船信息
包含车船信息,以业务数据库税种核定表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_CARXX报表AT
9
土地信息
包含土地信息,以业务数据库税种核定表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_LAND
10
房产税信息
包含房产税信息,以业务数据库税种核定表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_HOUSE
11
下岗失业信息
包含下岗失业信息,以业务数据库税种核定表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_OFFDPAYER
12
土地租赁信息
包含土地租赁信息,以业务数据库税种核定表为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_TAXPAYER_GRDLH
13
外籍自然人登记信息
包含外籍自然人登记信息,以业务数据库纳税人信息三张基本表和外籍自然人登记信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_DW_TAXPAYER_FORIND
14
自然人登记信息
包含自然人登记信息,以业务数据库纳税人信息三张基本表和自然人信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
●历史数据清理
R_TAXPAYER_NATURAL
15
重点户登记信息(3年内)
包含重点户登记信息,以业务数据库纳税人信息三张基本表和重点户信息为基础。
存3年内数据
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
●历史数据清理
R_IMPORTPAYER
16
历史重点户登记信息(3年以上)
包含历史重点户登记信息,重点户登记信息3年以上信息。
●每日抽取
●可无脏数据清理
●提供脏数据日志,事后清理
H_R_IMPORTPAYER
17
建安登记信息
包含建安登记信息,以业务数据库纳税人信息三张基本表和建安登记信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_DW_PROJECTREG
18
外管站登记信息
包含外管站登记信息,以业务数据库纳税人信息三张基本表和外管站信息为基础。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_WGZREG
19
应申报台账信息(3年内)
包含应申报台账信息,以业务数据库认定台帐为基础。
3年内信息
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
T_COGNIZE
20
历史应申报台账信息(3年以上)
包含历史应申报台账信息,存放认定台账信息。
3年以上信息
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
H_T_COGNIZE
21
认定信息表(3年内)
包含一般和双定认定信息。
3年内信息
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
●历史数据清理
T_COGNIZE_INFO
22
历史认定信息表(3年以上)
包含历史一般和双定认定信息。
3年以上信息
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
H_T_COGNIZE_INFO
23
建安自开票限定表
包含建安自开票限定信息。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
T_COGNIZE_JA
24
建筑安装客户端上传数据主表
包含建客户端数据上传信息。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
CD_BUILDREPORT
25
预算处重点户信息原始表
包含预算处原始录入重点户名单信息。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_A_YSCX
26
预算处重点户信息表
包含预算处重点户名单处理信息,增加纳税人名称、所属分局等查询信息。
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_A_YSC_INFO
27
交管局导出车辆信息
包含从交管局导入车船信息。
目前数据为一次性导入2009年6月18日前信息
●每日抽取
●无脏数据清理
●可提供脏数据日志,事后清理
R_VEHICLE_EXP_SW
二.1.3.2税收管理
注释:
上图灰色为暂不考虑,红色为暂不抽取。
序号
类别
名称
模型要求
数据表
28
税收管理
综合申报信息查询(3年内)
包含综合申报信息查询,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE
29
历史综合申报信息(3年以上)
包含历史综合申报信息,以综合申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE
30
企业所得申报(3年内)
包含企业所得税申报信息,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE_QYSD
31
历史企业所得申报(3年以上)
包含历史企业所得申报,以企业所得申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE_QYSD
32
营业税申报(3年内)
包含营业税申报信息,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE_YE
33
历史营业税申报(3年以上)
包含历史营业税申报,以企业所得申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE_YE
34
建安项目申报(3年内)
包含建安项目申报信息,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE_JAPROJECT
35
历史建安项目申报(3年以上)
包含历史建安项目申报,以企业所得申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE_JAPROJECT
36
车船税申报(3年内)
包含车船税申报信息,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE_HC
37
历史车船税申报(3年以上)
包含历史车船税申报,以企业所得申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE_HC
38
资源税申报(3年内)
包含资源税申报信息,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE_ZY
39
历史资源税申报(3年以上)
包含历史资源税申报,以企业所得申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE_ZY
40
自然人合伙人申报(3年内)
包含自然人合伙人申报信息,以业务数据库申报表为基础。
(3年以内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DECLARE_GRHH
41
历史自然人合伙人申报(3年以上)
包含历史自然人合伙人申报,以企业所得申报信息表为基础。
(3年以上信息)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_FD_DECLARE_GRHH
42
企业所得税年度减免申报
包含企业所得税减免申报信息,以业务数据库企业所得税申报表为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_DERATE_DECLARE
43
个人所得税12万申报
包含个人所得税12万申报信息,以业务数据库个人所得税12万申报表为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
FD_12PERSON
44
缓缴
表内无数据,只建表,不抽取
FD_LEVY_DELAY
45
开票未入库信息表
包含开票未入库信息,以业务数据库开票信息表为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_TICKET
46
当月征收入库(2个月)
包含征收入库,以业务数据库入库数据表为基础。
(2个月)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_MONTH
47
征收入库(3年内)
包含征收入库,以业务数据库入库数据表为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN
48
历史征收入库(3年以上)
包含征收入库,以业务数据库入库数据表为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_F_PAYIN
49
征收入库聚合(3年内)
包含征收入库信息,以征收入库为基础,聚合税种。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_AGG
50
当月税收明细表(2个月)
包含开票未入库、入库信息,以开票未入库信息,征收入库信息为基础。
(2个月)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_TAX_MONTH
51
税收明细表(3年内)
包含开票未入库、入库信息,以开票未入库信息,征收入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_TAX
52
当月本年重点税源入库(2个月)
包含重点税源信息,以入库信息为基础。
(2个月)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_VIP_MONTH
53
营业税入库(3年内)
包含营业税入库信息,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_YE
54
企业所得税入库(3年内)
包含企业所得税入库信息,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_QYSD
55
个人所得税入库(3年内)
包含个人所得税入库,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_GRSD
56
车船入库信息(3年内)
包含车船入库信息,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_CH
57
当月完税证信息(2个月)
包含完税证信息,以入库信息为基础。
(2个月)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYTAX_MONTH
58
完税证信息(3年内)
包含完税证信息,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYTAX
59
历史完税证信息(3年以上)
包含历史完税证信息,以完税证信息为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_F_PAYTAX
60
退税入库(3年内)
包含退税入库信息,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_TAXBACK
61
减免数据(3年内)
包含减免数据信息,以业务数据库中减免数据为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_DERATE
62
历史减免数据(3年以上)
包含历史减免数据信息,以减免数据信息为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_F_DERATE
63
车船税减免
包含车船税减免数据信息,以业务数据库及通达代征数据库中车船减免数据为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_DERATE_CARXX报表AT
64
建安外管入库信息(3年内)
包含建安外管入库信息,以入库信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_PAYIN_JAWG
65
历史建安外管入库信息(3年以上)
包含历史建安外管入库信息,以入库信息为基础。
(3年上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_F_PAYIN_JAWG
66
欠税信息表(3年内及所有未清欠信息)
包含欠税信息,以业务数据库欠税表为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_TAX_UNPAY
67
历史欠税信息表(3年以上已清欠欠税)
包含历史欠税信息,以业务数据库欠税表为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_F_TAX_UNPAY
68
欠税清欠核销信息(3年内)
包含欠税清欠核销信息,以业务数据库清欠、核销数据为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_UNPAY_PRINT
69
历史欠税清欠核销信息(3年以上)
包含历史欠税清欠核销信息,以业务数据库清欠、核销数据为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_F_UNPAY_PRINT
70
呆帐信息表
包含呆账信息,以业务数据库呆账数据为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
F_BADDEBT
二.1.3.3稽查信息
序号
类别
名称
模型要求
数据表
71
稽查管理
稽查案件信息
包含稽查案件信息,以业务数据库稽查案件表为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
W_CASEREGIST
72
稽查处罚信息
包含稽查处罚信息,以业务数据库稽查处罚表为基础。
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
W_PUNISH
73
稽查处罚入库(3年以内)
包含稽查处罚入库信息,以稽查入库为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
W_PAYIN
74
历史稽查处罚入库(3年以上)
包含历史稽查处罚入库信息,以稽查处罚入库基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_W_PAYIN
二.1.3.4票证发票
序号
类别
名称
模型要求
数据表
75
票证发票
纳税人发票信息(3年以内)
包含纳税人发票信息,以业务数据库发票为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
C_BUYSTOCKXX报表OK
76
历史纳税人发票信息(3年以上)
包含历史纳税人发票信息,纳税人发票信息表为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_C_BUYSTOCKXX报表OK
77
票证月结表(3年以内)
包含票证月结信息,以业务数据库票证为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
C_MONTHSTOCK
78
历史票证月结表(3年以上)
包含历史票证月结信息,以业务数据库票证为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_C_MONTHSTOCK
79
窗口代开发票(3年以内)
包含窗口代开发票信息,以业务数据库发票纳入所有窗口代开信息为基础。
(3年内)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
C_FORPRINT_DK
80
历史窗口代开发票(3年以上)
包含历史窗口代开发票信息,以业务数据库发票纳入所有窗口代开信息为基础。
(3年以上)
●每日抽取
●无脏数据清理
●提供脏数据日志,事后清理
H_C_FORPRINT_DK
二.1.4开发步骤
二.2维度表
二.2.1功能描述
将原有维度表抽取进行改造,同时按要求增加新维度表。
二.2.2操作权限
数据模型无权限要求。
二.2.3模型内容
序号
名称
模型要求
数据表
1
税务机关维表
根据原指标数据库税务机关维度表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAX_ORGAN
2
登记注册类型维表
根据原数据仓库登记注册类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_REGIST_TYPE
3
行业维表
根据原指标数据库行业维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_INDUSTRY_TYPE
4
呆账类型表
根据原数据仓库呆账类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_BADTYPE
5
预算级次维表
根据原数据仓库预算级次维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAXLEVEL
6
税款属性维表
根据原数据仓库税款属性维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAXSTATUS
7
税种维表
根据原指标数据库税种维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAX_KIND
8
征收方式维表
根据原数据仓库征收方式维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAXMODE
9
营业状态维表
根据原数据仓库营业状态维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_CHARACTER
10
提退类型维表
根据原数据仓库提退类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAXBACK_TYPE
11
申报方式维表
根据原数据仓库申报方式维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_DECLAREMODE
12
欠税类型维表
根据原数据仓库欠税类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAXUNPAY
13
减免类型维表
根据原数据仓库减免类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_DERATE_TYPE
14
减免原因维表
根据原数据仓库减免原因维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_DERATE_REASON
15
违章类型维表
根据原数据仓库违章类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_TAXPECCANCY_TYPE
16
稽查类型维表
根据原数据仓库稽查类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_INSPECTION_TYPE
17
稽查状态维表
根据原数据仓库稽查状态维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_INSPECTION_STATUS
18
稽查方法维表
根据原数据仓库稽查方法维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_INSPECTION_WAY
19
发票类型维表
根据原数据仓库发票类型维表改造。
●每日抽取
●建立空代码
●无历史数据处理
D_INVOICE_TYPE
20
地理区域维表
根据原数据仓库所地理区域维表改造。