多元统计课程设计参考范本Word文件下载.docx
《多元统计课程设计参考范本Word文件下载.docx》由会员分享,可在线阅读,更多相关《多元统计课程设计参考范本Word文件下载.docx(31页珍藏版)》请在冰豆网上搜索。
②运用主成分和因子分析,提取能综合解释所选省域地区经济发展的因素,并据此对各地区社会经济发展状况进行分类、比较和综合评价,给出具体数量关系表达式,并讨论所选综合指标间的相关性;
对模型结果做出合理化解释和经济发展建设相关建议。
达到系统展现省域社会经济发展状况,为政府决策者统筹区域规划提供参考依据的目的。
2.问题的分析
引言:
本小组成员打算借鉴汪潘义和王骑运用因子分析和聚类分析方法分析安徽省区域经济差异的经验,准备选取河北省2012年度11个地级市地区的经济发展状况相关指标和数据,分别利用聚类分析、主成分分析和因子分析三大分析方法建立经济综合评价的统计模型,借此系统展现省域社会经济发展状况全貌,分析所选省份区域经济发展差异,给出相关区域规划和经济政策制定建议的研究目标。
2.1课题模型假设
假设1:
本文为使问题研究系统化,全面化;
根据所学的宏观经济学课程知识,我们知道一个经济系统主要由投资、消费、储蓄、政府财政税收与购买等几大经济部门因素组成,为此本小组将影响河北省的社会经济发展的经济指标因素假定分为四大类部门层次进行综合考虑-政府财政税收因素,居民收入储蓄因素,消费因素,投资因素,以及考虑人口因素的综合核心指标因素-人均GDP,主要从宏观层面分析河北省(省域)国民经济发展情况。
假设2:
为保证实验结果的真实性和可靠信度,便于结果的经济分析和统计意义阐释,本小组成员的数据援引皆来自于河北省相应年度的统计年鉴,认为数据质量是可靠准确的,其次在数据指标的可比性和口径一致性上,我们认为各地级市地区间的同类指标具有可比性,且统计测算口径保持一致。
假设3:
聚类分析结果得到的经济类型具有区分度和可比性,主成分和因子分析得到的因子成分具有经济意义,便于统计阐释。
2.2课题指标选取
依据2.1节的假设1;
根据宏观经济学经济系统运行机制涉及的部门经济变量,我们特别选取了以下经济变量指标作为经济综合分析评价的参考值,并将变量参数符号做出如下约定和说明详情见表1:
表1河北省经济指标变量的数学模型参数含义
因素层次
变量设定
指标意义
备注
宏观核心
X1
人均地区生产总值
地区生产总值与人口数的比值(元/人),一个国家或地区的所有常住单位,在一定时期内,通常是一个季度或一年,生产的全部最终产品和劳务的价值
政府财政税收
X2
地方财政预算收入
地方财政年度收入(万元)
X3
地方财政支出
地方财政年度支出(万元)
居民收入储蓄
X4
在岗职工平均工资
在岗职工工资总额与在岗职工平均人数的比值(元),衡量区域居民工资性收入水平
X5
城乡居民储蓄年末余额
包括城镇居民储蓄存款和农民个人储蓄存款两部分(亿元),衡量消费和投资潜力
X6
城镇居民人均可支配收入
反映居民家庭全部现金收入能用于安排家庭日常生活的那部分收入,衡量居民生活水平
X7
农村居民人均纯收入
农村居民家庭全年总收入中,扣除经营费用支出、缴纳税款和上交承包集体任务金额以后剩余的,可直接支配的那一部分收入(元)
社会投资
X8
固定资产投资总额
以货币表现的建造和购置固定资产活动的工作量,反映固定资产投资规模、速度、比例关系和使用方向的综合性指标(亿元)。
X9
外商直接投资额
外商直接投资,衡量经济开放程度(万美元)
X10
交通运输、仓储和邮政业投资总额
高铁建设和电子商务业发展的相关指标(万元)
X11
批发和零售业投资总额
实体商务居民消费指标(万元)
X12
金融机构存款年底余额
包括本外币,反映企业和个人投资储备(亿元)
X13
金融机构贷款年底余额
包括本外币,反映实际企业和个人投资规模(亿元)
社会消费
X14
社会消费品零售总额
反映国内消费品和零售市场的总规模,也反映居民和社会集团对实物商品消费需求的总量和变化趋势(亿元)
X15
居民消费价格总指数
反映与居民生活有关的产品及劳务价格统计出来的物价变动指标,可以用来观察和分析消费品的零售价格和服务价格变动对城乡居民实际生活费支出的影响程度(选择某一年的消费价格为基期100)
备注:
图表指标说明
指标选取说明考量:
(1)宏观核心:
GDP作为少数几个能评价国家或地区国民经济发展情况的综合性核心指标,理应纳入河北省国民经济发展综合分析评价中来,考虑到各地级市区的人口变量差异,为此本小组选择了人均GDP作为经济变量综合性分析指标,以消除人口因素在结果分析中的影响(如经济总量大和教育医疗等消费水平高的地区人口相对也较多,特别是省会城市),确保结果统计分析的可靠性和各地区经济指标评价的相对可比性,当然在进行后续的统计结果分析时,应注意GDP这一综合指标与其他指标几乎都存在一定相关性的经济机制原理,在做出结果分析结论时,应仔细论证其与其他指标间的相关性强弱,从而避免统计信息的重复交叉,简化和准确提炼各市区经济发展的区域性差异和地区经济优势。
(2)政府财政税收:
在财政税收方面,本小组选取的是地方财政预算收入与实际支出两个指标,以此来衡量和评价政府作为经济主体,在市场经济运行中的购买支配和收入能力,之所以选取预算收入指标而非决算指标,我们认为政府作为经济主体,有其天然的垄断特点和调控主体责任的特殊性,其经济行为带有一定的前置性,政府一般在财政预算制度框架下实施经济行为,其市场经济行为一般是按预算方案做出决策,为此在进行国民经济综合评价时,我们在财政税收这一部门因素上选取的是预算收入而非决算指标,支出为实际指标,另外为简化分析,我们未另行严格论证和分析一般财政预算收入、总财政预算收入、财政预算收入在统计口径上的区别,假定地方财政预算收支这一财政税收统计口径具有相对可比性,忽略各地区间财政税收核算范围的区别,这与2.1节的模型假设2是一致的。
(3)居民收入储蓄:
考虑到居民储蓄是投资、消费的潜在动力和储备,与其他两部门因素具有相关性,以及我国作为世界上高储蓄率国家之一的现实(某一程度上反映了社会保障水平的高低),我们决定引入城乡居民储蓄年末余额这一经济指标,由于我国金融制度和相关产业发展与西方发达国家相比有一定的差距性,国民收入一般以工资性、劳务性收入为主,为此,我们主要选取在岗职工平均工资来衡量各地区居民收入差距和社会保障水平高低;
最后考虑到国家的新型城镇化和城乡一体化建设的国家政策方针和战略布局,我们有必要分别选取城镇居民和农民人均可支配收入指标,以此来分析各市区城乡居民收入差据和可支配的个人消费和投资潜力差距。
(4)社会投资:
考虑到我国各省市均以房地产投资为支柱产业的现实,在投资部门因素上,我们引进以货币表现的建造和购置固定资产活动的工作量,反映固定资产投资规模、速度、比例关系和使用方向的综合性指标——固定资产投资总额,随着我国对外开放程度日益加大,经济总量增长,经济产品质量提升,我国对外的经济贸易量逐年上升,国内企业走出去态势良好,外商投资环境改善,上海自贸区成立,外商企业引进和投资额度力度加大,国内企业海外投资和进出口额度也同步成为经济增长点,一路一带基金设立和亚投行筹建等国家海外开拓战略相继推行,为此有必要将各市区的外商直接投资额指标纳入经济发展评价和分析之中(考虑到河北省的分市区的进出口总额指标缺失,故选择了从外商投资额来衡量各市区的经济开发程度,略有指标统计分析和阐释上的不足)。
随着我国高铁建设和电子商务业的高速发展,批发和零售业和交通运输、仓储和邮政业投资总额是反映实体商贸经济活跃和投资水平的重要指标,自然有必要纳入。
最后考虑到国家金融改革步伐加快,互联网金融日益活跃于市场之中,为此本小组引入金融机构存贷款年底余额两个指标作为衡量地区金融杠杆实力带动投资、消费和经济发展的考量因素。
(5)社会消费:
本小组在衡量社会需要和居民消费水平的相关指标中,主要选取的是社会消费品零售总额和居民消费价格总指数(CPI)两大指标,以此来比较河北省各市区消费品的零售价格和服务价格变动对城乡居民实际生活费支出的影响程度和社会保障实际水平区域差异和零售市场活跃和规模程度差异,当然这两个指标在进行统计分析时,应重点结合客货运量等相关性较强的经济指综合分析评价。
2.3课题模型方法和求解方案
在2.1和2.2节的模型假设和指标选取分析基础,下面我们分别给出利用聚类分析、主成分分析和因子分析三大分析方法建立具体、初步的经济综合评价统计模型的解决方案。
2.3.1基于聚类分析
(1)思想与原理:
根据研究对象的特征对研究对象进行量化分类的多元统计分析技术的总称,它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。
根据样本的多指标(变量)、多个观察数据,通常那根据定义的各种距离来定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱谱系图。
(2)主要方法种类:
从研究的分类对象角度,通常将聚类分析分为Q型聚类和R型聚类,Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理,从计算量大小角度,通常分为系统聚类法和K均值快速聚类法。
具体方法介绍如下表2:
表2聚类分析相关方法
系统聚类
Methoeds
聚类方法
用法
Between-groupslinkage
类间平均链锁法
SPSS系统默认方法
Within-groupslinkage
类内平均链锁法
Nearestneighbor
最短距离法
Furthestneighbor
最长距离法
Centroidclustering
重心法
结合欧氏距离平方法
Medianclustering
中间距离法
Ward'
smethod
离差平方和法
结合欧氏距离平方法
快速聚类
MacQueenmethod
K均值聚类法
(3)模型方法方案设计
整体思路:
本文打算以Q型聚类分析技术(对样品、个案分类)进行分类,分别进行系统和快速聚类,在系统聚类上,集中选取最短、最远和离差平方和法进行系统聚类,比较分类差异,选取合理的系统分类结果,k均值分类主要是结合欧氏距离平方法,给出指定类数的分类结果,便于统计结果分析和经济差异阐述。
距离测量技术选择SquaredEuclideandistance(欧氏距离平方,