SPSS关于我国保险业的统计分析docx.docx

上传人:b****5 文档编号:4393772 上传时间:2022-12-01 格式:DOCX 页数:31 大小:79.70KB
下载 相关 举报
SPSS关于我国保险业的统计分析docx.docx_第1页
第1页 / 共31页
SPSS关于我国保险业的统计分析docx.docx_第2页
第2页 / 共31页
SPSS关于我国保险业的统计分析docx.docx_第3页
第3页 / 共31页
SPSS关于我国保险业的统计分析docx.docx_第4页
第4页 / 共31页
SPSS关于我国保险业的统计分析docx.docx_第5页
第5页 / 共31页
点击查看更多>>
下载资源
资源描述

SPSS关于我国保险业的统计分析docx.docx

《SPSS关于我国保险业的统计分析docx.docx》由会员分享,可在线阅读,更多相关《SPSS关于我国保险业的统计分析docx.docx(31页珍藏版)》请在冰豆网上搜索。

SPSS关于我国保险业的统计分析docx.docx

SPSS关于我国保险业的统计分析docx

SPSS关于我国保险业的统计分析

成绩评定表

学生姓名

王柳

班级学号

1309050109

专业

应用统计学

课程设计题目

我国各保险业基本情况的统计分析

 

 

组长签字:

成绩

 

日期

20年月日

指导教师:

2016年月日

专业负责人:

2016年月日

学院教学副院长:

2016年月日

摘要

自改革开放以来,我国的保险业一直处于高速发展状态,作为社会保障及金融体系的重要组成部分,有着不可替代的作用。

但是与发达国家保险市场相比,我国的保险业还存在着许多不完善的地方,而且我国的保险业在地域发展上也存在着巨大的差距。

保险数据分析是统计学的一个重要应用领域,从前期的保费核定工作开始,再经过一系列风险评估、赔付率计算,到后期的保费收入、报案量、结案量预测,统计理论贯穿始终。

随着保险业规模的不断扩大,各保险公司数据激增,亦趋于多元化,致使分析难度加大。

运用合理的统计理论和方法对保险业中的相关数据进行统计分析,探索保险业的发展规律,对指导我国保险业的健康发展具有重要意义。

本文运用统计学的理论和方法,针对我国保险业中的具体问题进行了探索研究。

具体来说,我们首先采用回归分析研究保费收入、储金、赔案件数、赔款支出、未决赔款、公司总人数、人员构成等变量之间的关系;然后使用因子分析对构成保费收入和赔款支出的各个变量提取因子;最后使用聚类分析依照人员构成特点、保费收入、赔款支出等变量对各财产保险公司进行聚类。

关键词:

回归分析;因子分析;聚类分析;

 

 

1保险业分析

1.1保险业分析的研究背景

进入21世纪以来,我国保险业持续快速发展,保险机构个数和保险业从业人数不断增加。

无论是保险机构个数还是保险业从业人数都呈现出持续快速的增长趋势。

伴随着保险机构和从业人员的不断增加,保险业的保费收入也持续增长,使得我国保险业呈现出良好的发展态势。

不管是财产保险公司,还是人寿保险公司,其保费收入都在不断增长。

在这种大背景下对我国目前的保险业进行研究,不论是对于促进我国保险业又好又快地发展,还是对于充分发挥保险业对于发展国民经济和改善居民生活的作用,都有着极为重要的意义。

1.2保险业分析的研究方法

按照我国目前保险业的惯例,对于财产保险公司,可以用5个变量来描述其保险业务情况:

保费收入、储金、赔案件数、赔款支出、未决赔款。

其中保费收入又按保险的特点分为企业财产保险费用收入、机动车辆保险保费收入、货物运输保险保费收入、责任保险保费收入、信用保证保险保费收入、农业保险保费收入、短期健康保险保费收入、意外伤害保险保费收入、其他保险保费收入等9个部分;赔款支出也按保险的特点分为企业财产保险费用支出、机动车辆保险保费支出、货物运输保险保费支出、责任保险保费支出、信用保证保险保费支出、农业保险保费支出、短期健康保险保费支出、意外伤害保险保费支出、其他保险保费支出等9个组成部分,所以在进行分析研究的时候,考虑的关于保险业务的变量也与这些叙述相吻合。

采用的数据分析方法主要有回归分析、因子分析、聚类分析。

基本思路是:

首先采用回归分析研究保费收入、储金、赔案件数、赔款支出、未决赔款、公司总人数、人员构成等变量之间的关系;然后使用因子分析对构成保费收入和赔款支出的各个变量提取因子;最后使用聚类分析依照人员构成特点、保费收入、赔款支出等变量对各财产保险公司进行聚类。

 

2课题设计

2.1数据来源

本次研究的数据来自于各保险公司人员结构情况.2014.《中国保险年鉴》、各财产保险公司业务统计.2014.《中国保险年鉴》。

2.2数据导入

由于本课题中数据量过大,只截取其中的一部分,完整数据请参照数据来源。

保险机构

保费收入合计

企业财产保险保费收入

机动车辆保险保费收入

货物运输保险保费收入

责任保险保费收入

信用保证保险保费收入

人保财险

88428.82

8867.30

62091.02

2978.79

3611.04

243.25

国寿财险

789.19

71.81

639.66

8.93

28.70

.17

大地

10028.40

576.32

7669.14

171.47

243.11

22.93

太平财险

5483.00

809.00

3280.00

201.00

498.00

61.00

中国信保

3413.55

278.60

2686.61

115.99

79.60

-12.42

阳光产险

3240.77

.00

.00

.00

.00

3240.77

中华联合

4153.46

279.14

3338.96

71.77

74.44

.78

太保产险

18342.07

670.32

14752.22

149.45

307.59

.09

平安产险

23433.04

2796.61

16474.97

895.06

518.25

-87.06

华泰财险

21449.53

2346.25

15165.45

641.81

615.76

88.56

天安保险

2563.63

237.88

1245.99

196.24

138.67

2.02

大众

7371.40

350.03

6556.86

85.37

118.04

.00

华安

1280.15

157.99

944.64

44.83

22.39

4.57

永安

11301.90

50.95

619.97

10.49

11.89

-7.60

永诚

5533.49

228.32

4766.02

36.67

113.34

16.31

安信农险

1505.61

438.94

838.29

11.76

37.74

.20

...

安邦财险

276.62

22.35

33.41

.25

2.45

.00

 

3数据分析过程

3.1回归分析

1、以“保费收入合计”为因变量进行线性回归

操作步骤如下:

(1)选择分析/回归/线性命令

(2)选择进行简单线性回归分析的变量。

在“线性回归”对话框的左侧列表框中选中“保费收入合计”选入“因变量”列表框,选中“男”“女”“博士”“硕士”“学士”“大专”“中专以下”“高级”“中级”“初级”“三十五岁以下”“三十六岁到四十五岁”“四十六岁以上”进入“自变量”列表框,最后在“自变量”下方的“方法”下拉表中采用“逐步”法进行回归。

(3)其他设置使用系统默认值即可。

(4)设置完毕后,单机“确定”按钮,得到输出结果。

2.以“赔款支出合计”为因变量进行线性回归

操作步骤如下:

(1)选择分析/回归/线性命令

(2)选择进行简单线性回归分析的变量。

在“线性回归”对话框的左侧列表框中选中“赔款支出合计”选入“因变量”列表框,选中“男”“女”“博士”“硕士”“学士”“大专”“中专以下”“高级”“中级”“初级”“三十五岁以下”“三十六岁到四十五岁”“四十六岁以上”进入“自变量”列表框,最后在“自变量”下方的“方法”下拉表中采用“逐步”法进行回归。

(3)其他设置使用系统默认值即可。

(4)设置完毕后,单机“确定”按钮,得到输出结果。

3.2因子分析

1.使用构成保费收入的各个变量提取公因子

操作步骤如下:

(1)选择分析/降维/因子分析命令

(2)选择进行因子分析的变量。

在“因子分析”对话框的左侧列表框中选择“企业财产保险费用收入”“机动车辆保险保费收入”“货物运输保险保费收入”“责任保险保费收入”“信用保证保险保费收入”“农业保险保费收入”“短期健康保险驳费收入”“意外伤害保险保费收入”“其他保险保费收入”选入“变量”列表框。

(3)选择输出系数相关矩阵。

单击“因子分析”对话框的“描述”按钮,在“相关矩阵”选项组中选中“KMO和Bartlett的球形度检验”,单击“继续”按钮返回“因子分析”对话框(4)设置对提取公因子的要求及相关输出内容。

单击“因子分析”对话框的“抽取”按钮,在“输出”选项组中选中“碎石图”,单击“继续”按钮返回“因子分析”对话框。

(5)设置因子旋转方法。

单击“因子分析”对话框中“旋转”按钮,在“方法”选项组中选中“最大方差法”。

(6)设置有关因子得分的选项。

单击“因子分析”对话框中“得分”按钮,在本对话框中选中“保存为变量”“显示因子得分系数矩阵”然后单击“继续”按钮返回“因子分析”对话框。

(7)其他设置使用系统默认值即可。

(4)设置完毕后,单机“确定”按钮,得到输出结果。

2.对构成赔款支出的各个变量提取公因子

操作步骤如下:

(1)选择分析/降维/因子分析命令

(2)选择进行因子分析的变量。

在“因子分析”对话框的左侧列表框中选择“企业财产保险费用”“机动车辆保险保费支出”“货物运输保险保费支出”“责任保险保费支出”“信用保证保险保费支出”“农业保险保费支出”“短期健康保险驳费支出”“意外伤害保险保费支出”“其他保险保费支出”选入“变量”列表框。

(3)选择输出系数相关矩阵。

单击“因子分析”对话框的“描述”按钮,在“相关矩阵”选项组中选中“KMO和Bartlett的球形度检验”,单击“继续”按钮返回“因子分析”对话框(4)设置对提取公因子的要求及相关输出内容。

单击“因子分析”对话框的“抽取”按钮,在“输出”选项组中选中“碎石图”,单击“继续”按钮返回“因子分析”对话框。

(5)设置因子旋转方法。

单击“因子分析”对话框中“旋转”按钮,在“方法”选项组中选中“最大方差法”。

(6)设置有关因子得分的选项。

单击“因子分析”对话框中“得分”按钮,在本对话框中选中“保存为变量”“显示因子得分系数矩阵”然后单击“继续”按钮返回“因子分析”对话框。

(7)其他设置使用系统默认值即可。

(4)设置完毕后,单机“确定”按钮,得到输出结果。

3.3聚类分析

1.使用构成保费收入的各个变量对各个保险公司进行聚类

操作步骤如下:

(1)选择分析/聚类/分类/K均值聚类命令

(2)选择进行聚类分析的变量。

在“K均值聚类分析”对话框的左侧列表框中选中“保险机构”选入“个案标记依据”列表框,选择“企业财产保险费用收入”“机动车辆保险保费收入”“货物运输保险保费收入”“责任保险保费收入”“信用保证保险保费收入”“农业保险保费收入”“短期健康保险驳费收入”“意外伤害保险保费收入”“其他保险保费收入”选入“变量”列表框。

在编辑框“聚类数”中,输入聚类分析的类别数4,其他选择默认值(3)设置输出及缺失值处理方法。

单击“K均值聚类分析”对话框的“选项”按钮,在“统计量”复选框选中全部三个复选框,在“缺失值”选项组中选中默认值即可。

设置完毕后,单击“继续”按钮返回“K均值聚类分析”对话框(3)其他设置使用系统默认值即可。

(4)设置完毕后,单机“确定”按钮,得到输出结果。

2.使用构成赔款支出的各个变量对各个财险公司进行聚类

操作步骤如下:

(1)选择分析/聚类/分类/K均值聚类命令

(2)选择进行聚类分析的变量。

在“K均值聚类分析”对话框的左侧列表框中选中“保险机构”选入“个案标记依据”列表框,选择“企业财产保险费用支出”“机动车辆保险保费支出”“货物运输保险保费支出”“责任保险保费支出”“信用保证保险保费支出”“农业保险保费支出”“短期健康保险驳费支出”“意外伤害保险保费支出”“其他保险保费支出”选入“变量”列表框。

在编辑框“聚类数”中,输入聚类分析的类别数4,其他选择默认值(3)设置输出及缺失值处理方法。

单击“K均值聚类分析”对话框的“选项”按钮,在“统计量”复选框选中全部三个复选框,在“缺失值”选项组中选中默认值即可。

设置完毕后,单击“继续”按钮返回“K均值聚类分析”对话框(3)其他设置使用系统默认值即可。

(4)设置完毕后,单机“确定”按钮,得到输出结果。

 

4保险业分析结论

4.1回归分析结果

1、以“保费收入合计”为因变量进行线性回归分析

表4.1.1变量的输入或移去情况

变量的输入或者移去情况

模型

變數已輸入

變數已移除

方法

1

四十六岁以上

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

2

中专以下

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

3

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

4

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

5

硕士

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

6

四十六岁以上

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

7

博士

.

逐步(准则:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

a.因变量:

保费收入合计

表4.1.1给出了变量进入回归模型或退出模型的情况。

本题采用逐步法,所以显示的是依次进入模型的变量以及进入与剔除的判别准则。

表4.1.2模型摘要

模型摘要

模型

R

R平方

調整後R平方

標準偏斜度錯誤

1

.985a

.970

.970

2493.52168

2

.989b

.977

.976

2219.71513

3

.993c

.986

.985

1780.08295

4

.994d

.988

.986

1668.02401

5

.995e

.990

.989

1497.81841

6

.996f

.992

.990

1408.25778

7

.996g

.993

.991

1338.51340

表4.1.2给出了随着变量进入依次形成的7个模型的拟合情况。

可以发现7个模型修正的可决系数(调整的R方)在依次递增,而且都在0.97以上,所以,模型的拟合情况非常好。

 

表4.1.3方差分析表

方差分析表

模型

平方和

df

平均值平方

F

顯著性

1

迴歸

8165998655.013

1

8165998655.013

1313.358

.000b

殘差

248706015.590

40

6217650.390

總計

8414704670.603

41

2

迴歸

8222546394.723

2

4111273197.361

834.415

.000c

殘差

192158275.880

39

4927135.279

總計

8414704670.603

41

3

迴歸

8294294249.055

3

2764764749.685

872.525

.000d

殘差

120410421.548

38

3168695.304

總計

8414704670.603

41

4

迴歸

8311759419.494

4

2077939854.873

746.841

.000e

殘差

102945251.110

37

2782304.084

總計

8414704670.603

41

5

迴歸

8333940110.514

5

1666788022.103

742.954

.000f

殘差

80764560.090

36

2243460.002

總計

8414704670.603

41

6

迴歸

8345293021.890

6

1390882170.315

701.336

.000g

殘差

69411648.713

35

1983189.963

總計

8414704670.603

41

7

迴歸

8353789654.712

7

1193398522.102

666.101

.000h

殘差

60915015.892

34

1791618.114

總計

8414704670.603

41

a.應變數:

保费收入合计

b.預測值:

(常數),中级

c.預測值:

(常數),中级,高级

d.預測值:

(常數),中级,高级,大专

e.預測值:

(常數),中级,高级,大专,三十六岁到四十五岁

f.預測值:

(常數),中级,高级,大专,三十六岁到四十五岁,中专以下

g.預測值:

(常數),中级,高级,大专,三十六岁到四十五岁,中专以下,博士

h.預測值:

(常數),中级,高级,大专,三十六岁到四十五岁,中专以下,博士,四十六岁以上

表4.1.3给出了随着变量的进入依此形成的7个模型的方差分析结果。

可以发现p值一直为0.000,模型的整体极为显著。

 

表4.1.4系数

系数

模型

非標準化係數

標準化係數

T

顯著性

B

標準錯誤

Beta

1

(常數)

749.905

404.906

1.852

.071

中级

5.391

.149

.985

36.240

.000

2

(常數)

996.009

367.692

2.709

.010

中级

7.301

.579

1.334

12.604

.000

高级

-17.812

5.258

-.359

-3.388

.002

3

(常數)

500.422

312.720

1.600

.118

中级

8.063

.491

1.474

16.410

.000

高级

-33.364

5.335

-.672

-6.254

.000

大专

.492

.103

.203

4.758

.000

4

(常數)

578.575

294.690

1.963

.057

中级

11.144

1.313

2.036

8.488

.000

高级

-48.988

7.992

-.986

-6.129

.000

大专

1.526

.424

.628

3.601

.001

三十六岁到四十五岁

-1.905

.760

-.641

-2.505

.017

7

(常數)

299.011

256.893

1.164

.253

中级

12.364

2.269

2.259

5.449

.000

高级

-48.063

9.662

-.968

-4.974

.000

大专

2.713

.432

1.116

6.284

.000

三十六岁到四十五岁

-6.253

1.240

-2.104

-5.041

.000

中专以下

1.466

.439

.352

3.338

.002

博士

146.304

60.505

.111

2.418

.021

四十六岁以上

2.145

.985

.405

2.178

.036

a.應變數\:

保费收入合计

表4.1.4给出了随着变量的进入依次形成的7个模型的自变量系数。

因为本表太大,所以删去了中间的一部分,这不影响最后的结果。

可以发现只有第7个模型的各个自变量系数是非常显著的。

综上所述:

1.最终模型的表达式(即第7个模型):

保费收入合计=12.364*中级-48.063*高级+2.713*大专-6.253*三十六岁到四十五岁+1.466*中专以下+146.304*博士+2.145

2.最终模型的拟合度很好,修正决定系数接近1.

3.模型整体显著,p值为0.000

4.在最终模型中,各自变量系数的显著性p值都小于0.05,显著。

5.经过以上多重线性回归分析可以发现,我国保险公司的总保费收入水平与公司职员的性别并无显著关系,与公司职员年龄、职称、文化水平有一定的显著关系。

其中中级职称或者大专、中专以下、博士学历或者四十六岁以上的职员对公司的总保费收入具有拉动效应,尤其是博士学历的职员,每增加一个单位会带来对应保费收入的140多倍的增加;高级职称或者三十六岁到四十五岁的职员对公司的总保费收入具有拖后效应。

2.以“赔款支出合计”为因变量进行线性回归分析

表4.1.5变量的输入或移去情况

变量的输入或者移去情况

模型

變數已輸入

變數已移除

方法

1

中级

.

逐步(準則:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

2

中专以下

.

逐步(準則:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

3

博士

.

逐步(準則:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

4

初级

.

逐步(準則:

F-to-enter的機率<=.050,F-to-remove的機率>=.100)。

a.因变量:

赔款支出合计

表4.1.5给出了变量进入回归模型或退出模型的情况。

本题采用逐步法,所以显示的是依次进入模型的变量以及进入与剔除的判别准则。

表4.1.6模型摘要

模型摘要

模型

R

R平方

調整後R平方

標準偏斜度錯誤

1

.985a

.971

.970

1303.02930

2

.990b

.980

.979

1081.73595

3

.996c

.992

.991

696.68101

4

.997d

.994

.993

608.45217

a.預測值:

(常數),中级

b.預測值:

(常數),中级,中专以下

c.預測值:

(常數),中级,中专以下,博士

d.預測值:

(常數),中级,中专以下,博士,初级

表4.1.6给出了随着变量进入依次形成的4个模型的拟合情况。

可以发现4个模型修正的可决系数(调整的R方)在依次递增,而且都在0.97以上,所以,模型的拟合情况非常好。

 

表4.1.7方差分析表

方差分析表

模型

平方和

df

平均值平方

F

顯著性

1

迴歸

2261542996.568

1

2261542996.568

1331.976

.000b

殘差

67915414.156

40

1697885.354

總計

2329458410.724

41

2

迴歸

2283822457.087

2

1141911228.543

975.865

.000c

殘差

45635953.637

39

1170152.657

總計

2329458410.724

41

3

迴歸

231101456

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 数学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1