ImageVerifierCode 换一换
格式:DOCX , 页数:28 ,大小:150.67KB ,
资源ID:7677560      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/7677560.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(spss教程第三章.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

spss教程第三章.docx

1、spss教程第三章第三章 相关分析与回归模型的建立与分析相关分析和回归分析是统计分析方法中最重要内容之一, 是多元统计分析方法的 基础。相关分析和回归分析主要用丁研究和分析变量之间的相关关系, 在变量之间寻求合适的函数关系式,特别是线性表达式。本章主要内容:1、 对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate )和偏相关分析(Partial )。2、 建立因变量和自变量之间回归模型 (Regression ),其中包括线性回归分析(Linear )和曲线估计(Curve Estimation )。数据条件:参与分析的变量数据是数值型变量或有序变量。

2、3.1相关分析在SPSS中,可以通过 Analyze菜单进行相关分析(Correlate ), Correlate 菜 单如图3.1所示。ReE.Gr tsDescriptive Stati stiesTablesMewsvarGftner*1 ModtltHixed ModLelsBi var i G .Rer essi ojiParti al.Lglinear口i stances.Cl si-fj:Reduction hScileFN onp ar am e tr i c TestskTime Ser i tsSurvivalMultiple ResponseM i ssing Value

3、 s.CgpL即 Sample5相关分析菜单图 3.1 Correlatedialyzegraphs Utilities 心 nd 网 Help3.1.1简单相关分析两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系。一是通过散点图直观地显示变量之间关系,二是通过相关系数准确地反映两变量的关 系程度。3.1.1.1 散点图SPS歌件的绘图命令集中在Graphs菜单。下面通过例题来介绍具体操作方法例1:数据库SY-8中的变量X表示山东省人均国内生产总值,Y表示山东省城镇居 民的消费额(资料来源:山东省2003年统计年鉴),现画出散点图来观察两个变量的 关联程度。具体操作步骤如下

4、:首先打开数据SY-8,然后单击Graphs t Scatter,打开Scatter plot散点图对话 框,如图3.2所示。然后选择需要的散点图,图中的四个选项依次是:Simple简单散点图 Matrix矩阵散点图Overlay重叠散点图 3-D三维散点图图3.2散点图对话框如果只考虑两个变量,可选择简单的散点图Simple,然后点击Define,打开Simple Scatterplot对话框,如图3.3所示。图 3.3 Simple Scatterplot 对话框选择变量分别进入X轴和Y轴,点击OK后就可以得到散点图,见图3.4。从下面输出的人均国内生产总值与城镇居民消费额的散点图 3.4

5、中可以粗略地看出,两个变量之间有强正相关的线性关系。8000人均国内生产总值(元)图3.4 散点图*.1.1.2 简单相关分析操作简单相关分析是指两个变量之间的相关分析,主要是指对两变量之间的线性相关 程度作出定量分析。仍然数据SY-8为例,说明居民收入与某商品的销售量两变量的相 关分析过程,具体操作如下:1、打开数据库 SY-8后,单击 Analyze t Correlate t Bivariate 打开 Bivariate 对话框,见图3.5所示。图3.5 Bivariate : Correlation 两变量相关分析对话框2、从左边的变量框中选择需要考察的两个变量进入 Variables

6、 框内,从Correlation Coefficients 栏内选择相关系数的种类,有Pearson相关系数,Kendall s一致性系数和Spearmar#级相关系数。从检验栏内选择检验方式,有双尾检验和单尾检验两种3、单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统 计描述,见图3.6所示。:Options 对话框图 3.6 Bivariate Correlation4、单击OK可以得到相关分析的结果。从表3.1 (a)可以得到两个变量的基本统计描述,从表 (b)中可以得到相关系数 及对相关系数的检验结果,由丁尾概率就小丁 0.01 ,故说明两变量之间存在着显著的

7、 线性相关性。表3.1 (a)基本统计描述Descriptive StatisticsMeanStd. DeviationN城镇居民消费额(元) 人均国内生产总值(元)2582.28003689.88002335.963843701.507982525表3.1 (b)相关系数检验Correlations城镇居民消费额(元)人均国内生产总值(元)城镇居民消费额(元)Pearson Correlation1.998(*)Sig. (2-tailed).000N2525人均国内生产总值(元)Pearson Correlation.998(*)1Sig. (2-tailed).000.N2525* C

8、orrelation is significant at the 0.01 level (2-tailed).从表3.1 (b)中可以看到两个变量相关性分析的结果:相关系数是 0.998,相关程度非常高,且假设检验的P值远远地小丁 0.05,可以认为居民收入与某产品的销量 存在线性正相关关系。简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响, 不能真实地反映二者之间的关系,所以需要考察在其它因素的影响剔除后二者之间的相关程 度,即偏相关分析。例2:为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量

9、、 打火石销量作为影响因素,得数据表3.2。试求火柴销售量与煤气户数的偏相关系数.表3.2 火柴销量及影响因素表(见参考文献 1)年份火柴销售量煤气户数卷烟销量蚊香销量打火石销量(万件)(万户)(百箱)(十万盒)(白力粒)6823.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.714

10、1.1645.1626.3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17解:根据数据表建立数据文件SY-9,求解火柴销售量与煤气户数的偏相关系数具 体操作如下:1、首先打开数据文件 SY-9,单击 Analyze t Correlate t Partial ,打开 Par

11、tial Correlations对话框,见图3.7所示。图 3.7 Partial Correlations2、 从左边框内选择要考察的两个变量进入 Variables框内,其它客观存在的变量 作为控制变量进入Controlling for框内,如本例中考察煤气户数与火柴销量的偏相 关系数进入Variables框内,其它相关变量(除年份外)进入 Controlling for框内。3、 单击Options按纽,打开Options对话框如图3.8所示。从Statistics 栏中 选择输出项,有平均值及标准差,Zero-order correlations 表示在输出偏相关系数 的同时输出变量

12、问的简单相关系数。另外还有缺失值的处理方式。本例中选择简单相 关系数。图 3.8 Partial Correlate: Options 对话框4、选择结束后,单击OK寻输出结果,如表3.3所示。表3.3 偏相关分析输出表-P A R TI A L C O R R E L A TI O N C O E F F I C IE N T S -Zero Order Partials 简单相关火柴销量 1.0000 .8260 -.4902.8083 .8788 (简单相关系数)( 0) ( 13) ( 13) ( 13)(13)(自由度)P= . P= .000 P= .064 P=.000P= .0

13、00(P值)煤气户数 .8260 1.0000 -.0230.9489 .9029(13) ( 0) ( 13) ( 13)(13)P= .000 P= . P= .935 P=.000P= .000打火石量 -.4902 -.0230 1.0000 -.0070 -.0295(13) ( 13) ( 0) ( 13) ( 13) P= .064 P= .935 P= . P= .980 P= .917蚊香销量 .8083 .9489 -.0070 1.0000 .9030( 13) ( 13) ( 13) ( 0) ( 13) P= .000 P= .000 P= .980 P= . P=

14、.000卷烟销量 .8788 .9029 -.0295 .9030 1.0000( 13) ( 13) ( 13) ( 13) ( 0) P= .000 P= .000 P= .917 P= .000 P=.(Coefficient / (D.F.) / 2-tailed Significance).is printed if a coefficient cannot be computed-P A R T I A L C O R R E L A T I O N C O E F F I C IE N T S 偏相关系数-Controlling for (控制变量). 打火石量 蚊香销量 卷烟销

15、量火柴销量 煤气户数火柴销量 1.0000 .6046 (偏相关系数)(0) ( 10) (自由度)P= . P= .037 ( P值)煤气户数 .6046 1.0000(10) ( 0)P= .037 P=.(Coefficient / (D.F.) / 2-tailed Significance).is printed if a coefficient cannot be computed表中的上半部分是简单相关系数,下半部分是偏相关系数。从表中可以看出,火 柴销量与煤气户数的简单相关系数为0.8260 ,自由度为13,检验的P值为0.000 ;而偏 相关系数为0.6046 ,自由度为10

16、,检验的P值为0.037 ,表示煤气户数对火柴销量的真 实影响是显著的。线性回归是统计分析方法中最常用的方法之一。 如果所研究的现象有若干个影响 因素,且这些因素对现象的综合影响是线性的, 则可以使用线性回归的方法建立现象(因变量)与影响因素(自变量)之间的线性函数关系式。由丁多元线性回归的计算 量比较大,所以有必要应用统计分析软件实现。 这一节将专门介绍SPS歌件的线性回 归分析的操作方法,包括求回归系数,给出回归模型的各项检验统计量值及相应的概 关,对输出结果的分析等相关内容。3.2.1 线性回归模型假设条件与模型的各种检验1、 线性回归的假设理论(1)正态性假设:即所研究的变量均服从正态

17、分布;(2)等方差假设:即各变量总体的方差是相等的;(3)独立性假设,即各变量之间是相互独立的;(4)残差项无自相关性,即误差项之间互不相关, Cov(谷,目)=02、 线性回归模型的检验项目(1)回归系数的检验(t检验)。(2)回归方程的检验(F检验)。(3)拟合程度判定(可决系数R2)。(4)D.W检验(残差项是否自相关)。(5)共线性检验(多元线性回归)。(6)残差图小分析(判断异方差性和残差序歹0自相关)。3.2.2 线性回归分析的具体步骤SPS歌件中进行线性回归分析的选择项为 Analyze tRegression tLinear 0如图 3.9所示。下面通过例题介绍线性回归分析的操

18、作过程。ReportsDescriptive StatisticETablesComipare MeanGeneral Linear Model图3.9 Regression 分析功能菜单例3.仍然用例2的数据,考察火柴销售量与各影响因素之间的相关关系,建立火 柴销售量对丁相关因素煤气户数、卷烟销量、蚊香销量、打火石销量的线性回归模型, 通过对模型的分析,找出合适的线性回归方程。解:建立线性回归模型的具体操作步骤如下:1、 打开数据文件 SY-9,单击 Analyze t Regression t Linear 打开 Linear 对 话框如图3.10所示。2、 从左边框中选择因变量Y进入De

19、pendent框内,选择一个或多个自变量进入 Independent框内。从Method框内下拉式菜单中选择回归分析方法,有强行进入法 (Enter),消去法(Remove),向前选择法(Forward),向后剔除法(Backward)及逐步回 归法(Stepwise)五种。本例中选择逐步回归法(Stepwise)。图 3.10 Linear Regression 对话框3、单击 Statistics ,打开 Linear Regression : Statistics 对话框,可以选择输出的统计量如图3.11所示。Regression Coefficients 栏,回归系数选项栏。Estim

20、ates (系统默认):输出回归系数的相关统计量:包括回归系数,回归系数 标准误、标准化回归系数、回归系数检验统计量(t值)及相应的检验统计量概率的P 值(sig )。本例中只选择此项。Confidence intervals: 输出每一个非标准化回归系数95%的置信区问。Covariance matrix: 输出协方差矩阵。与模型拟合及拟合效果有关的选择项。Model fit是默认项。能够输出复相关系数 R F2及R修正值,估计值的标准误, 方差分析表。R squared change:引入或剔除一个变量时,点的变化。Descriptives: 基本统计描述。Part and Partial

21、 correlations :相关系数及偏相关系数。Collinearity diagnostics :共线性诊断。主要对丁多元回归模型,分析各自变 量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指数等。本例中选择上面所有的统计项。Residuals残差栏Durbin-Watson : D.V验.Casewise diagnostics: 奇异值诊断,有两个选项:Outliers outside( )standard deviations: 奇异值判据,默认项标准差 3。All case 输出所有观测量的残差值。本例中选择D.W检验及奇异值诊断,选择标准差为2,即置信度约为9

22、5%图 3.11 Linear Regression : Statistics4、如果需要观察图形,可单击 Plots按纽,打开Linear Regression : Plots对话 框如图3.12所示。在此对话框中可以选择所需要的图形。图3.12 Linear Regression : Plots 对话框在左上角的源变量框中,选择Dependent进入X (或Y)轴变量框,选择其它变量 进入Y (或X)轴变量框,除因变量外,其客观存在变量依次是:ZPREDte准化预测值, ZRESID标准化残差,DRESID剔除残差,ADJPRED多正后预测值,SRESI畔生化残差, SDRESID学生化剔

23、除残差。Standardized Residual Plots 栏,标准化残差图类型,有选择项:Histogram:标准化残差直方图Normal probability plot 标准化残差序歹0的正态分布概率图.Produce all partial plots 依次绘制因变量和所有自变量的散布图本例中选择因变量Dependent与标准化残差ZRESID勺残差图。5、单击 Options 按纽,打开 Linear Regression : Options 对话框,如图 3.13所示。 可以从中选择模型拟合判断准则 Stepping Method Criteria 及缺失值的处理方式。图 3.

24、13 Linear Regression : Options 对话框Stepping Method Criteria 栏,设置变量引入或剔除模型的判别标准。Use probability of F: 采用针佥验的概率为判别依据。Use F value:采用F值作为检验标准。Include constant in equation 回归方程中包括常数项。Missing Values 缺失值的处理方式。本例中选择系统默认项。6、 如果要保存预测值等数据,可单击 Save纽打开Linear Regression : Save 对话框。选择需要保存的数据种类作为新变量存在数据编辑窗口。 其中有预测值、

25、残 差,预测区间等。本例中不做选择。7、 当所有选择完成后,单击O时到分析结果。主要的分析结果见表3.4。表3.4(a) Model Summary(d) 模型综合分析表ModelRR SquareAdjustedR SquareStd. Error of the EstimateChange Statistics 变动分析Durbin-WatsonR Square ChangeFChangedf1df2Sig. F Change1.879(a).772.7552.44047.77244.085113.0002.994(b).988.986.58304.216215.772112.0003.9

26、97(c).994.993.41783.00612.365111.0052.066a Predictors: (Constant),卷烟销量(万箱)b Predictors: (Constant), 卷烟销量(万箱),打火石销量(百万粒)c Predictors: (Constant), 卷烟销量(万箱),打火石销量(百万粒),煤气户数(万户)d Dependent Variable:火柴销量(万件)表3.4 (a)模型综合分析中有模型的复相关系数 R,样本决定系数F2,修正的可 决系数R2,估计标准误,模型变化导致的可决系数及 F值的变化,D.V检验值等。由 上表中知模型3的修正的可决系数为

27、0.993,其模型的拟合程度最好, DW值为2.066, 显然通过D他验,说明残差项不存在一阶自相关。表3.4 (b)方差分析表ANOVA dModelSum ofSquar esdfMean SquareFSig.1 RegressionResidual Total262.56677.427339.99311314262.5665.95644.085.000 a2 RegressionResidual Total335.9144.079339.99321214167.957.340494.090.000 b3 RegressionResidual Total338.0731.920339.9

28、9331114112.691.175645.483.000 ca.Predicto rs: (Co nstant), 万箱b.Predicto rs: (Co nstant), 万箱,百万粒c.Predicto rs: (Co nstant), 万箱,百万粒,万户d.Dependent Va ria ble:万件方差分析表3.4 (b)同时给出了 3个模型的方差分析表。其中模型3的F值最大, 说明模型3的回归效果最显著。表3.4 (c)回归系数Model非标准化回归系数UnstandardizedCoefficients标准化回归系数StandardizedCoefficients检验统计量tP值Sig.相关系数Correlations共线性统计CollinearityStatistics单相关容忍度方差膨Std.Zero-or偏相关Toleranc胀因子BErrorBetaderPartialParteVIF1(Constant)13.3921.9996.698.000卷烟销量(万箱).320.048.8796.640.000.879.879.8791.0001.0002(Constant)17.240.54531.647.000卷烟销量(万箱).315.0

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1