基于spss的多元回归分析模型选取的研究毕业设计Word格式文档下载.docx
《基于spss的多元回归分析模型选取的研究毕业设计Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《基于spss的多元回归分析模型选取的研究毕业设计Word格式文档下载.docx(30页珍藏版)》请在冰豆网上搜索。
关键词:
统计学,SPSS,变量的选取,多元回归分析
Abstract
ThisarticlenotonlyforcomplexstatisticalcalculationsdonebythecommonlyusedcomputerapplicationsoftwareofSPSS,throughtheempiricalanalysisofthetwogroupsofdataatthesametime,tostudythestatisticsofthevariablesinthemultivariateregressionanalysis,leteverybodyinthemultipleregressionanalysisofstatisticalmodelselectionaswellastheselectionofvariablesandoperationmethodshaveadeeperunderstanding.Isasetofdataforthefuturedevelopmenttrendofresearchtaobaotransactions,asetofdatafortheresearchofourcountry'
sfiscalrevenue.Inthispaper,throughtwoempiricaltaobaotransactionsandfiscalrevenueresearchfromdifferentdegreeofthestudyofnonlinearregressionmodelandvariableselectionusingacommonlanguageandplaintheSPSSstatisticalanalysismethodinmultipleregressionanalysisofpresentinfrontofeveryone,leteveryonetomultipleregressionanalysisandSPSSsoftwarecanhaveadeeperunderstanding.ThroughSPSSsoftwaretoanalyzedata,andsummarizesmethodofdataprocessing,findouttheadvantagesanddisadvantagesofSPSSfordataprocessingandanalysis,finallyhadtoputforwardtheproposaltotheoperationoftheselectionofvariablesandsoftware.
Keywords:
Statistical,SPSS,Theselectionofvariables,multipleregressionanalysis
摘要1
Abstract1
引言3
第一章多元回归模型的选取4
1.1回归分析的概述4
1.1.1回归分析的概念及主要内容4
1.1.2回归分析研究的问题及应用5
1.2相关系数的概述5
1.3非线性回归模型的概述6
1.4多元线性回归模型自变量的选择6
第二章非线性回归模型案例:
淘宝交易额模型的研究7
2.1回归模型变量的确定7
2.1.1数据的来源7
2.1.2复相关系数8
2.1.3散点图看线性关系9
2.1.4回归分析看拟合度12
2.1.5确定回归模型变量12
2.2调整后的变量的相关分析12
2.2.1散点图12
2.2.2计算相关系数14
2.3多元线性回归分析17
2.4小结18
第三章变量选取案例:
财政收入模型的研究19
3.1数据的来源及变量的选取19
3.2相关分析20
3.2.1散点图20
3.2.2计算相关系数22
3.3回归分析25
3.4逐步回归26
3.5小结28
第四章总结28
参考文献30
引言
随着社会的发展,统计的运用范围越来越广泛,统计学作为高等院校经济类专业和工商管理类专业的核心课程,不管是在经济管理领域,或是在军事、医学等领域的研究中对于数量分析与统计分析都需要更高的要求,需要用到的数学知识较多,应用方面的灵活性也较强,计算量大且复杂.然而科学研究的深入,研究的对象也日益变得复杂,复杂系统的研究问题更是成为当今研究的热点.为了更好的描述一个复杂的现象,就需要大量的数据和信息,如何高效、准确地利用已知的信息便成为当今社会研究的一项重要课题.
在科学技术飞速发展的今天,统计学通过不断吸收和融合相关学科的新理论,开发应用新技术和新方法,拓展新的领域的同时不断深化和丰富了统计学传统领域的理论与方法.在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求.随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘.从20世纪60年代开始,关于回归自变量的选择成为统计学中研究的热点问题,统计学家提出了许多回归选元的准则,并提出了许多行之有效的选元方法.在应用回归分析去处理实际问题时,回归自变量选择是首先要解决的重要问题.通常在做回归分析时,人们根据所研究问题的目的,结合经济理论罗列出对因变量可能有影响的的一些因素作为自变量引进回归模型,把一些对因变量影响很小的,有些甚至是没有影响的自变量,不但使得计算量变大,估计和预测的精度也下降了.此外,如果遗漏了某些重要变量,回归方程的效果肯定不好.SPSS软件作为当今国际上运用广泛的统计分析软件,其功能齐全带有各种特点,在各个领域内都得到了迅速普及,并成为各个行业提高管理水平、形成科学决策的重要手段.然而,我国对于该软件的运用和理解始终处于早期应用阶段,无论是在功能的研究开发还是实际生活当中的运用都与西方发达国家相差甚远.尤其是在管理决策方面,都因为没有进行深度分析而造成了浪费,要么就是利用SPSS软件进行简单分析而未进行深度开发,导致所得的信息有限、各信息间的关系不明确,最终导致管理者的判断出现偏差.
基于以上背景,本文通过总结和吸取其他国内外学者对统计学研究的,并结合我国的实际情况,本文采用了案例一对于网络购物这块的的研究,通过对2005年到2012年的居民消费水平,以及我国网络普及度,我国人人均纯收入以及我国的居民消费水平对淘宝网的未来发展趋势进行非线性回归模型的研究以及案例二对于我国财政收入的进行变量选取研究,通过对1992年到2012年的人均国内生产总值,城镇居民家庭人均可支配收入,全社会固定投资,进出口总额,居民消费价格水平对我国财政收入的影响进行定量数据的研究.通过对数据的选取,回归模型的确定以及软件的操作方法来告知读者如何在SPSS的操作中变量选取的原则、要求和方法.
第1章多元回归模型的选取
1.1回归分析的概述
1.1.1回归分析的概念及主要内容
回归分析是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法(即寻找具有相关关系的变量减的数学表达式并进行统计推断的一种统计方法).
1)运用十分广泛,按照其所涉及的自变量,可分为一元回归分析和多元回归分析;
2)线性回归分析和非线性回归分析是按照自变量和因变量之间的关系划分的.
一元线性回归分析是指一个自变量与一个因变量之间的线性关系可以用一条近似直线来表示.而本文运用了多元线性回归分析中的方法,多元线性回归分析就是指回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系.
多元回归分析的主要内容为:
1)从一组数据出发,确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数.估计参数的常用方法是最小二乘法.
2)对这些关系式的可信程度进行检验.
3)在许多自变量共同影响着一个因变量的关系中,判断哪些自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归等方法.
4)利用所求的关系式对某一生产过程进行预测或控制.
在回归分析中,把变量分为两类.因变量和自变量,因变量是实际问题中所关心的一类指标,通常用表示;
而影响因变量取值的变量叫自变量,常用来表示.
1.1.2回归分析研究的主要问题及应用
回归分析研究的主要有如下四个问题:
(1)确定与间的定量关系表达式,这种表达式称为回归方程;
(2)对求得的回归方程的可信度进行检验;
(3)判断自变量对因变量有无影响;
(4)利用所求得的回归方程进行预测和控制.
回归分析主要应用于研究两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,通过分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;
如果能够很好的拟合,则可以根据自变量作进一步预测.
1.2相关系数的概述
相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量.相关关系是现象间客观存在的,但数值又是不严格及不完全确定的相互依存关系.
1)复相关系数
在一元回归分析中我们用相关系数来说明两变量之间线性相关的程度,在多元回归分析中,仍用它来表示与其他自变量之间的线性密切程度,此为复相关系数.复相关是指因变量与多个自变量之间的相关关系.复相关系数只是反映变量间表面的非本质的联系,因为变量很有可能受到其他变量的影响.
2)偏相关系数
在多变量的情况下,变量之间的相关系数是相当复杂的.任意两个变量之间都有可能存在着相关关系,因此,只知道被解释变量与解释变量的总的相关程度是不够的.如果需要了解某两个变量间的相关程度,就应在消除其他变量影响的情况下来计算他们的相关系数,这就是偏相关系数.偏相关系数与复相关系数不同,复相关系数的取值在0-1之间,而偏相关系数则是有正有负,所以复相关系数与偏相关系数之间也有可能相差很大.变量之间本存在错综复杂的关系,甚至可能使得符号也相反,但是偏相关系数才是变现变量之间的本质联系的.
偏相关的主要用途:
偏相关主要是用来研究自变量与因变量之间的关系的,其通过得到的自变量与因变量数据来进行计算,通过偏相关系数