主成分分析在地区综合消费价格指数评价中的应用.docx

上传人:b****3 文档编号:24929489 上传时间:2023-06-02 格式:DOCX 页数:14 大小:25.73KB
下载 相关 举报
主成分分析在地区综合消费价格指数评价中的应用.docx_第1页
第1页 / 共14页
主成分分析在地区综合消费价格指数评价中的应用.docx_第2页
第2页 / 共14页
主成分分析在地区综合消费价格指数评价中的应用.docx_第3页
第3页 / 共14页
主成分分析在地区综合消费价格指数评价中的应用.docx_第4页
第4页 / 共14页
主成分分析在地区综合消费价格指数评价中的应用.docx_第5页
第5页 / 共14页
点击查看更多>>
下载资源
资源描述

主成分分析在地区综合消费价格指数评价中的应用.docx

《主成分分析在地区综合消费价格指数评价中的应用.docx》由会员分享,可在线阅读,更多相关《主成分分析在地区综合消费价格指数评价中的应用.docx(14页珍藏版)》请在冰豆网上搜索。

主成分分析在地区综合消费价格指数评价中的应用.docx

主成分分析在地区综合消费价格指数评价中的应用

主成分分析在地区综合消费价格指数评价中的应用

摘要利用主成份分析法,对我省14个城市,8种消费指标进行综合评价,通过使用统计软件matlab进行计算和分析,提出用第一主成份作为地区消费水平的度量,得到了这些地区综合消费水平的排列次序,从另一侧面反映了各个地区的经济发展,综合实力状况。

居民消费价格指数(简称CPI),是通过一组代表性消费商品及服务项目的价格水平变动,反映居民家庭所购买的消费品及服务的价格水平变动情况的相对数。

它是宏观经济分析和决策的重要指标,因此,各国政府都重视对这一指标的统计和研究。

关键词主成分分析各市消费指标综合评价居民消费价格指数CPI

1.我国居民消费价格指数的现状

居民消费价格指数(ConsumerPriceIndex,cPl)是一个反映居民家庭一般所购买的消费商品和服务价格水平变动情况的指标。

一般说来当CPI>3%的增幅时,我们称为通货膨胀;而当CPI>5%的增幅时.我们把他称为严重的通货膨胀。

如果消费价格指数升幅过大,表明通胀已经成为经济不稳定因素,央行会有紧缩货币政策和财政政策的风险,从而造成经济前景不明朗。

从围家统计局公布的2009年1月到2010年10月的数据。

可以明显的看出我国已经进人通货膨胀期,从2009年1月开始就超过15%的,然而尽管国家已经采取了紧缩的货币政策,上调存贷款基准利率;l上调存款准备金率;加大央行票据发行力度和频率;以特别国债开展正回购操作等。

但是2009年1月以来,我国还是维持在高的通货膨胀水平.因此进行居民消费价格指数的预测分析更显得尤为必要。

2.建立各城市多个经济指标的主成分分析的数学模型

下列数据是2005年全省14个市自治区8项经济指标数。

指标编号:

X1食品、X2衣着、X3居住、X4家庭设备用品、X5交通和通讯、X6文教娱乐用品及服务、X7医疗和保险、X8杂项和服务

地区编号:

1沈阳、2大连、3鞍山、4抚顺、5本溪、6丹东、7锦州、8营口、9阜新

10辽阳11盘锦、12铁岭、13朝阳、14葫芦岛

数据摘自《多元统计分析实验》指导书,数据文件为wangpeng.mat。

2.趋势模型的选择

为了对我国CPI的变化有更加全面和深入的把握和认识,现观测从2009年1月~2011年10月居民消费价格指数的全部数据.由以上数据可以看出,因为居民消费价格指数受到如经济增长、特别是国家宏观货币政策等因素的影响,因此,在价格分析中,需要通过对各月的价格环比进行统计和分析,以剔除“翘尾”的影响环比中还应注意分析季节性因素。

建议在分析CPI变动中应充分考虑这一局限因素。

2.1主成分分析

主成分分析(PrincipalComponentAlqa1ysis)也称主分量分析.主成分分析是利用降低维度的思想.在损失很少的信息的前提下把多个指标转化为几个综合指标的多元统计方法一般情况下.将转化后生成的综合指标称为主成分.其中每一个主成分都是原始变量的线性组合.并且各个主成分之间是线性无关的.这样就使得主成分比原始变量具有更优越的性能.这样就使得在研究复杂问题时可以只考虑少数几个主要成分而不至于损失太多的信息.从而更容易抓住主要的矛盾.揭示事务内部变量之间的联系和规律.同时将问题得到简化.提高分析的效率。

2.2模型的理论假设及思想方法

上述问题涉及到8个指标,分别用X1、X2、X3、···、X8表示,这8个指标构成的8维随机向量为X=(X1、X2、⋯⋯、X8)T,假设随机向量X的均值为u.对X进行现行变换,可以形成新的综合变量.用F表示,也就是说.新的综合变量可以由原来的变量线性表示.即满足下列式子:

F1=u11Xl+u12X2+⋯+ul11X8;(2-1)

F2=u21Xl+u22X2+⋯+u211X8;(2-2)

F31=u311Xl+u312X2+⋯+u3111X8;(2-3)

上述线性变换要在下列原则下进行约束:

①uil+ui2+ui3+⋯+ui14=1;②Fi与Fj相互无关(i与j不相等且ij=1,2,⋯,5);③F1是X1、X2、⋯、X8的一切满足原则1的线性组合中方差最者;F1是与F2不相关的X1、X2、⋯、X14所有线性组合中的方差最大者;⋯⋯;F14是与F1,F2⋯F13都不相关的X1、X2、⋯、X8所有线性组合中的方差最大者。

基于以上三条原则决定的综合变量F1、F2、···F14分别称为原始变量的第1、2、⋯、14个主成分并且各个综合变量在总方差中所占的比重是依次递减的如果上述以部分主成分F1F2```Fk(k<5)就可以反映指标所包含的较大部分的信息量.而且主成分之间是不详关系的.这样就可以用少数的几个互不相关的主成分代替原始指标来分析解决问题。

2.3模型数据分析

步骤1:

原始数据的初始化。

clear

loadwangpeng

[n,p]=size(wangpeng);

MEAN=mean(wangpeng);%求各变量的均值

STD=std(wangpeng);%求各变量的标准差

MEAN=ones(n,p)*diag(MEAN);

STD=ones(n,p)*diag(STD);

x=(wangpeng-MEAN)./STD;%原始数据标准化

步骤2:

求取指标间的相关系数矩阵。

原始变量与主成分之间的相关系数

R=cov(x);

步骤3:

的特征根

及相应的单位特征向量

[V,D]=eig(R);

步骤4.写出主成分

⑴计算主成份的方差贡献率和累计方差贡献率

DD=[];%将特征值对角矩阵D改写为列向量DD

fori=p:

-1:

1%此处要注意eig函数的输出D中特征值的排列顺序

DD=[DD;D(i,i)];

end

OFFER=DD/sum(DD);%计算特征值的方差贡献率

cumOFFER=cumsum(DD)/sum(DD);%计算特征值的方差累计贡献率

OUTCOME=[DD,OFFER,cumOFFER]%综合输出计算结果

OUTCOME=

表1初始特征值

主成分特征值方差贡献率累计方差共享率

13.66600.45830.4583

21.43340.17920.6374

30.89490.11190.7493

40.81260.10160.8509

50.63210.07900.9299

60.31270.03910.9690

70.19740.02470.9936

80.05080.00641.0000

表3主成分系数矩阵

⑵选取主成分

根据特征值的方差累计贡献率,取前3个,前三个成分它们的累计贡献率为74.93%,基本上保留了原来的指标的信息.这样原来的8个指标就可以通过这3个指标来反映.故选取了这四个主成分F1、F2、F3就起到了降低维度的作用。

PCACOV=V(:

end:

-1:

end-1)%输出正交单位化的特征向量矩阵V的前3列

PCACOV=V(:

end:

-1:

end-3)

PCACOV=

0.3859-0.3585-0.1794

0.39930.28110.0513

0.22090.5890-0.3766

0.3385-0.49310.3201

0.31890.27210.5588

0.34000.19870.3823

0.3960-0.2917-0.3321

0.39260.0614-0.3901

可以得出前4个主成分F1、F2、F3的线性组合为:

第一主成份为:

F1=0.3859X1+0.3993X2+0.2209X3+0.3385X4+0.3189X5+0.3400X6+0.3960X7+0.3926X8;第一主成份由食品、医疗保健及个人用品、交通与通信、居住组成的综合指标(基本生活保障);

第二主成份为:

F2=-0.3585X1+0.2811X2+0.5890X3-0.4931X4+0.2721X5+0.1987X6-0.2917X7+0.0614X8;第二主成分由家庭设备用品及服务组成指标;

第三主成份为:

F2=-0.1794X1+0.0513X2-0.3766X3+0.3201X4+0.5588X5+0.3823X6-0.3321X7-0.3901X8;第三主成分由交通和通讯组成指标

通过对上述线性组合的观察.我们可以得出:

这样就将城市的8个主要居民消费水平指标通过主成分分析归结为基本生活保障指标、家庭设备用品及服务以及交通和通讯指标.这三个指标相互作用.共同反映农村居民生活消费水平状况。

综合以上各项建立综合主成分分析模型:

F=3.6660F1+1.4334F2+0.8949F3

以下是各市主成份的得分排名:

大连

盘锦

鞍山

营口

阜新

沈阳

丹东

本溪

辽阳

1.0491

1.0014

0.9812

0.9445

0.8968

0.8937

0.8917

0.7981

0.7928

抚顺

锦州

葫芦岛

朝阳

铁岭

0.7809

0.7444

0.7170

0.7097

0.6550

4结语

毫无疑问,CPI总水平及其动态指数是国际上通用的宏观经济分析的重要指标,以此可对一国或地区的总供求状况、居民消费状况和经济形势作出基本判断。

然而,CPI并不是唯一的指标。

由于不同国家的经济发展水平、居民生活消费水平、恩格尔系数,以及CPI统计中的消费品和服务的类别以及权重不尽相同,都会对CPI的统计和分析产生影响。

因此,仅仅通过CPI水平和动态指数来分析宏观形势,并以此作出相应的宏观调控政策选择,则难免会失之偏颇。

由上述分析可知、由食品、医疗保健与个人用品、交通与通信、居住构成的第一主成分及由家庭设备用品及服务构成的第二主成分以及交通和通讯指标是影响CPI增长的主要因素。

分析可知、这些影响CPI的因素的增长、是造成经济通货膨胀的主要原因。

它们引起的是需求拉动型的通货膨胀。

为了抑制需求拉动型的通货膨胀,在政策上,可以通过减少政府支出、减少货币供给、增加税收、提高利率等紧缩性政策来实现。

参考文献

[1]黄文贤.NBA球员综合能力的统计分析.中国科技论文在线

[2]蒋慧萍.基于多远统计模型的广西人口增长分析.企业科技与发展.2010年第10期

[3]郭均鹏,李汶华.基于经验相关矩阵的区间主成分分析.管理科学学报.2008年第6期11卷3

[4]陈勇滨主成份分析在地区综合消费水平评析中的应用.华北科技学院2006第一期第三卷

 

附录

loadwangpeng

[n,p]=size(wangpeng)

n=

14

p=

8

MEAN=mean(wangpeng)

MEAN=

1.0e+003*

Columns1through6

1.23150.24460.44430.10930.31570.3708

Columns7through8

1.24350.0727

STD=std(wangpeng)

STD=

Columns1through6

247.046146.9075109.346121.169049.031892.3504

Columns7through8

26.2754

MEAN=ones(n,p)*diag(MEAN)

MEAN=

1.0e+003*

Columns1through6

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

1.23150.24460.44430.10930.31570.3708

Columns7through8

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

0.24350.0727

 

STD=ones(n,p)*diag(STD)

STD=

Columns1through6

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

247.046146.9075109.346121.169049.031892.3504

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

40.664026.2754

 

x=(wangpeng-MEAN)./STD

x=

Columns1through6

0.00290.95320.37000.15460.6460-0.1405

1.77010.8259-0.06981.39271.30640.9042

0.07880.71851.7560-0.11610.09071.2368

-0.8554-0.46750.7907-1.76951.4416-0.7091

0.3328-0.9103-0.6406-0.1718-1.9466-0.2927

1.04490.5343-0.7140-0.2621-0.0590-0.4571

-0.9498-0.83801.4877-0.6754-1.1836-0.9338

-0.50291.13100.78430.67421.19892.6799

0.8965-0.7858-0.92972.09890.5840-0.1392

-0.16000.8035-0.7258-0.62440.0256-0.9557

1.54981.34930.91500.37280.2000-0.2788

-1.2176-0.8649-1.2429-0.8086-0.8334-0.8749

-0.7984-1.8364-0.7461-0.9263-0.74940.0294

-1.1916-0.6127-1.03480.6610-0.7214-0.0684

Columns7through8

-0.8239-0.4370

0.91861.5595

1.76112.4071

-0.4371-0.8804

0.2345-0.1626

0.02500.2454

-0.4059-0.9820

-0.3048-0.0876

1.8302-0.8138

-0.79470.2945

0.78830.4452

-1.5784-0.5752

-0.7507-1.1986

-0.46220.1856

R=cov(x)

R=

1.00000.53160.04740.57210.32330.15290.68010.4793

0.53161.00000.42230.28720.58040.41370.25020.6213

0.04740.42231.0000-0.15130.29840.34050.30490.3097

0.57210.2872-0.15131.00000.26860.44550.61850.3017

0.32330.58040.29840.26861.00000.43770.25170.2253

0.15290.41370.34050.44550.43771.00000.35320.4503

0.68010.25020.30490.61850.25170.35321.00000.5507

0.47930.62130.30970.30170.22530.45030.55071.0000

 

[V,D]=eig(R)

V=

0.3128-0.61280.14520.14760.4172-0.1794-0.35850.3859

-0.51190.14710.4174-0.30420.45660.05130.28110.3993

0.32410.11380.33770.4332-0.2068-0.37660.58900.2209

0.28860.50910.39010.0215-0.21120.3201-0.49310.3385

0.13590.1223-0.50580.35960.30560.55880.27210.3189

-0.0791-0.51230.0562-0.2495-0.60390.38230.19870.3400

-0.57170.0752-0.28160.4063-0.2663-0.3321-0.29170.3960

0.31660.2182-0.4474-0.5838-0.0327-0.39010.06140.3926

D=

0.05080000000

00.1974000000

000.312700000

0000.63210000

00000.8126000

000000.894900

0000001.43340

00000003.6660

DD=[];fori=p:

-1:

1DD=[DD;D(i,i)];end

OFFER=DD/sum(DD);%计算特征值的方差贡献率

cumOFFER=cumsum(DD)/sum(DD);%计算特征值的方差累计贡献率

OUTCOME=[DD,OFFER,cumOFFER]%综合输出计算结果

OUTCOME=

3.66600.45830.4583

1.43340.17920.6374

0.89490.11190.7493

0.81260.10160.8509

0.63210.07900.9299

0.31270.03910.9690

0.19740.02470.9936

0.05080.00641.0000

PCACOV=V(:

end:

-1:

end-3)

PCACOV=

0.3859-0.3585-0.17940.4172

0.39930.28110.05130.4566

0.22090.5890-0.3766-0.2068

0.3385-0.49310.3201-0.2112

0.31890.27210.55880.3056

0.34000.19870.3823-0.6039

0.3960-0.2917-0.3321-0.2663

0.39260.0614-0.3901-0.0327

 

z=[0.8093;0.1075;0.0398];F=wangpeng*PCACOV;FF=F*z%主成分的得分计算

FF=

1.0e+003

0.8637

1.0491

0.9812

0.7809

0.7981

0.8917

0.7444

0.9445

0.8968

0.7928

1.0014

0.6550

0.7097

0.7170

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 成人教育 > 专升本

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1