ImageVerifierCode 换一换
格式:DOCX , 页数:34 ,大小:901.63KB ,
资源ID:6284042      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/6284042.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(SPSS指导书.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

SPSS指导书.docx

1、SPSS指导书目 录(一)因子分析 (二)聚类分析 (三)回归分析 (四)判别分析 实验一:因子分析一、实验目的:运用因子分析方法分析数据二、内容:1. SPSS操作2. 因子分析三、案例背景:现有24名同学身高、体重、坐高、胸围、肩宽、盆骨宽此6项数据,有没有可能用更少的数据说明每位同学的身体状况?实验步骤:步骤一:导入数据步骤二:确定数据类型(Variable View)步骤三:输入数据(data view)并确定分析方法Variables列表框:用箭头按钮从左边列表框中选择想要分析的变量名移动到右边,准备分析。Descriptive按钮:单击该按钮,打开对话框,并在其中设置描述统计量(在

2、需要得到的统计量前的括号打钩)。Univariate descriptive:计算单变量描述信息,包括个变量有效值的个数,均值和标准差。Initial solution:计算初始解。包括变量的初始共同度,因子特征值,各特征值占特征值之和的百分数及累计百分数。Coefficients:生成相关系数矩阵。Significance levels:生成相关系数矩阵中的单侧显著性水平Determinant:生成相关系数矩阵的行列式。Kmo and bartletts test of sphericity:进行kmo和bartlett检验。Inverse:生成相关系数矩阵的逆矩阵Reproduced:生成

3、再生相关矩阵,并给出原相关矩阵与再生相关矩阵数据的差Anti-image:生成反映像相关矩阵选择完毕后,单击continueExtraction按钮:单击该按钮打开对话框,进行因子设置。Method:选择提取因子方法。(本次选择principle components)Correlation matrix:生成相关矩阵Covariance matrix:生成协方差矩阵Unrotated factor solution:显示没有旋转的因子载荷、公共因子和特征值Scree plot:显示碎石图Eigenvalues over:在后面的窗口输入数值,确定提取特征值大于该数值的因子Number of

4、factors:人为确定因子个数Maximum iterations for :确定最大迭代次数选择完毕后,单击continueRotation按钮:进行矩阵旋转设置。None:不旋转Loading plot:显示前3个因子的三维因子载荷图;对于两因子求解,输出二维图选择完毕后,单击continueScores按钮:进行因子得分选项设置。Save as variables:将因子得分保存为新变量Method:Regression:用回归的方法计算因子得分(此例选择此项)Display factor score coefficient matrix:计算因子得分系数矩阵选择完毕后,单击conti

5、nueOption按钮:设置缺失值的处理方式(本例中无缺失值)和系数显示格式Sorted by size:按大小排序Suppress absolute values lee:在后面窗口输入一个正数,确定系数的绝对值不得大于该数值。步骤四:表格分析相关系数矩阵表(correlation matrix):表中行的第一部分为相关系数矩阵,第二部分为原假设为相关系数为零的单侧显著性检验概率矩阵总方差解释表(total variance explained):Component:因子序号Total:特征值的大小% of variance:特征根占方差的百分比Cumulative:特征根占方差的累计百分比

6、因子载荷矩阵(component matrix):表中对应各变量的两个因子的载荷值再生相关矩阵表(reproduced correlations):再生相关矩阵表,表中行的第一部分为再生相关系数矩阵,矩阵中对角线元素为再生共同度。表中行的第二部分为残差矩阵。旋转后因子载荷表(rotated component matrix):旋转坐标轴后的因子载荷因子得分系数矩阵(component score coefficient matrix)四、练习下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。X1X2X3X4X5X6X73.768.596.2

7、27.579.035.513.278.749.649.738.597.124.695.511.665.909.848.394.947.239.469.554.948.219.413.664.996.147.287.083.980.627.009.491.332.985.493.011.341.615.769.274.924.382.307.315.354.523.086.440.541.344.527.072.591.300.443.311.031.001.173.682.171.271.571.551.512.541.031.771.044.254.502.425.115.2810.029.

8、8412.6611.766.923.3611.6813.579.879.179.725.985.812.808.8413.6010.056.687.7912.0011.748.079.1012.509.777.502.171.794.545.337.633.5313.139.877.852.642.764.571.785.409.023.966.494.3911.582.771.793.752.4513.7410.162.732.106.227.308.844.7618.5211.069.913.433.555.382.097.5012.675.249.065.3716.183.512.104

9、.663.104.782.131.090.821.282.408.391.122.353.702.621.192.013.433.721.971.751.432.812.272.421.051.291.720.91四、实验小结:实验中遇到的问题及解决办法、心得体会等等.实验二:聚类分析一、实验目的:运用聚类分析方法分析数据二、内容:1SPSS操作2聚类分析三、案例背景:现有5名同学学科背景(1为文科,2为理科),抽象能力,形象能力,创新能力的资料,用聚类分析将其分类。实验步骤:步骤一:导入数据步骤二:确定数据类型及标准化上图为选择需要标准化的参数上图表示选择完毕后要将标准化后变量值保存,单击“

10、ok”步骤三:确定分析方法Variable:从左边列表框中选择作为聚类分析对象的变量Lable cases:在该窗口输入变量名,对应变量值作为个案的标注Cluster:Cases:对个案聚类Variables:对变量聚类Display:Statistics:输出分析统计量Plots:输出分析得到的图形Statistics按钮:Agglomeration schedule:生成聚结表Proximity matrix:生成组间距矩阵Cluster membership:设置有关变量与聚类步骤之间的关系(此例选择none)Plots按钮:Dendrogram:生成树形图Icicle:设置冰柱图有关参

11、数Method按钮:Save按钮:none:不保存新变量single solution:输入整数n,生成一个新变量,用该变量保存聚为n类时个案所对应的类range of solution:输入一小一大两个数值,分别保存参数聚为这两个数之间类数时,各个案对应的类步骤四:表格分析上图为“聚结表”:Stage:聚类步骤号Cluster combined:在某步中合并的个案。如在第一步中,个案3、4合并Coefficients:距离或相似系数。距离最小或相似系数最接近1的最先合并Stage cluster first appears:如果合并中,有哪一个是新生成的类(即由两个或两个以上个案合并成的类)

12、,则在对应列显示该新类是在哪一步中第一次生成的。Next stage:表示新类将在第几步中与其他个案或类合并 Vertical IcicleNumber of clustersCase5:case5 4:case4 3:case3 2:case2 1:case11XXXXXXXXX2XXXXX XXX3X XXX XXX4X XXX X X上图为垂直冰挂图,第一列为聚类步骤号,第一行为个案号。如果个案或类在第n步中合并,则在第n步以上合并项之间的列用“x”填充。所以,冰挂图应从下往上读解。如图所示,3,4先合并;然后1、2合并;然后5与3、4合并得到的新类合并;最后1、2合并的类跟3、4、5合

13、并的类做最后合并。 * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ case3 3 case4 4 case5 5 case1 1 case2 2 上图为树状图,分析类似“冰挂图”四、练习29名儿童的血红蛋白(g/100ml)与微量

14、元素(g/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。编号N0.钙X1镁X2铁X3锰X4铜X5血红蛋白X6123456789101112131415161718192021222324252627282954.8972.4953.8164.7458.8043.6754.8986.1260.3554.0461.2360.1769.6972.2855.1370.0863.0548.7552.2852.2149.7161.0253.6850.2265.3456.3966.1273.8947.31

15、30.8642.6152.8639.1837.6726.1830.8643.7938.2034.2337.3533.6740.0140.1233.0236.8135.0730.5327.1436.1825.4329.2728.7929.1729.9929.2931.9332.9428.55448.70467.30425.61469.80456.55395.78448.70440.13394.40405.60446.00383.20416.70430.80445.80409.80384.10342.90326.29388.54331.10258.94292.80292.60312.80283.0

16、0344.20312.50294.70 0.012 0.008 0.004 0.005 0.012 0.001 0.012 0.017 0.001 0.008 0.022 0.001 0.012 0.000 0.012 0.012 0.000 0.018 0.004 0.024 0.012 0.016 0.048 0.006 0.006 0.016 0.000 0.064 0.0051.0101.6401.2201.2201.0100.5941.0101.7701.1401.3001.3800.9141.3501.2000.9181.1900.8530.9240.8171.0200.8971.

17、1901.3201.0401.0301.3500.6891.1500.83813.5013.0013.7514.0014.2512.7512.5012.2512.0011.7511.5011.2511.0010.7510.5010.2510.00 9.75 9.50 9.25 9.00 8.75 8.50 8.25 8.00 7.80 7.50 7.25 7.00五、实验小结:实验中遇到的问题及解决办法、心得体会等等.实验三:回归分析一、实验目的:运用一元线性回归与多元线性回归进行预测二、内容:1spss操作2一元线形回归3多元线性回归 三、实验背景:已知某工厂14年间的产值,用回归分析法预测

18、未来产值。实验步骤:步骤一: 先看散点图:拖曳图标选择横纵坐标含义:观察直观图形,确定是否存在线性关系:确定线性回归:确定自变量和应变量:点击“plots”绘制图形:DEPENDNT:因变量;ZPRED:标准化预测值;ZRESID:标准化残差等等。SCATTER:从左侧候选变量框中选择变量X,Y轴变量,定义需要绘制的回归分析诊断图或预测图。STANDARDIZED RESIDUAL PLOTS:选择绘制标准化残差图的类型,包括直方图HISTOGRAM,标准正态图NORMAL PROBABILITY PLOT。PRODUCES ALL PARTIAL PLOTS:选择是否绘制每一个自变量与因变量

19、残差的散点图。点击“ok”观察所生成图表:表示变量进入、推出模型的基本情况上表表示回归模型的拟合程度。第一列表示选择的回归方法种类,第二列表示复相关系数,其含义类似相关系数,反映的是自变量和应变量之间的密切程度。其值在0到1之间,越大表示相关程度愈好。第三列表示复相关系数的平方,又称为决定系数。需要注意的是复相关系数随着自变量个数的增加会不断变大。所以在多元线性回归模型中复相关系数就不太可靠,这就是需要引入调整后的复相关系数的原因。第四列表示调整后的复相关系数,该值是在考虑了模型中自变量个数情况下计算的决定系数。第五列表示标准差。上表为方差分析表,F值为F检验的统计值,sig表示由统计检验值得

20、到的显著性水平。上表给出了拟合未标准化和标准化之后的回归系数,并通过t检验方法对拟合结果进行检验。上表给出了一些与残差有关的统计量,包括预测值,标准化后的预测值,残差,标准化的残差,及其最小值,最大值,平均值,标准差,样本容量。上图为标准化残差直方图上图为标准化残差正态p-p图,如果变量值服从正态分布,则绘制的概率图为一条从纵轴零点指向右上角的直线。案例背景二:已知某工厂13年的产出及可能与产出相关的4个因素,请用回归分析法预测未来产出情况。步骤二:首先选择线性回归选择自变量和应变量:选择STATISTICS按钮:Estimation:输出回归系数的估计值及其标准误,检验统计量,标准化的回归系

21、数等Confidence intervals:输出每个回归系数95%的置信区间Covariance matrix:输出每个变量的相关矩阵、方差、协方差矩阵Model fix:输出回归模型变量的一些检验统计量Descriptives :输出描述性统计量Collinearity diagnostics:输出统计量用于判断是否存在多重共线性Duibin-watson:输出DW值用以判断是否存在序列相关现将不同于一元线性回归中图形做如下说明:上表用以输出参数的均值,标准差,及样本容量上表用以描述个参数相关系数等统计指标上表显示x3,x4的显著性水平过大,需调整变量。上表用于判断是否存在多重共线性。四、

22、练习某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号体表面积(Y)身高(X1)体重(X2)123456789105.3825.2995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.0五、实验小结:实验中遇到的问题及解决办法、心得体会等等.实验四:判别分析一、实验目的:运用判别分析进行分类预测二、内

23、容:1SPSS操作2聚类分析三、案例背景:为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了50-59岁冠心病人15例和正常人16例的舒张压和胆固醇指标,结果如下,试作判别分析,建立判别函数以便在临床中用于筛选冠心病人。编号冠心病人组编号正常人组舒张压kPax1胆固醇mmol/Lx2舒张压kPax1胆固醇mmol/Lx21234567891011121314159.8613.3314.669.3312.8010.6610.6613.3313.3313.3312.0014.6613.3312.8013.335.183.733.897.105.494.094.453.635.965.706.

24、194.014.013.635.961234567891011121314151610.6612.5313.339.3310.6610.669.3310.6610.6610.6610.409.3310.6610.6611.209.332.074.453.063.944.454.923.682.773.215.023.944.922.692.433.423.63实验步骤:1建立数据文件。舒张压、胆固醇的变量名分别以x1、x2表示,将冠心病人资料和正常人资料合并,一同输入。再定义一变量名为result,用于区分冠心病人资料和正常人资料,即冠心病人资料的result值均为1,正常人资料的result

25、值均为2。2选择菜单“AnalyzeClassifyDiscriminant”项,弹出“Discriminant Analysis”对话框。从对话框左侧的变量列表中选择变量result,进入“Grouping Variable”框,并单击“Define Range”按钮,在弹出的“Discriminant Analysis: Define Range”对话框中,定义判别原始数据的类别区间,在Minimum处输入1,在Maximum处输入23从对话框左侧的变量列表中选x1、x2,使之进入“Independents”框,作为判别分析的基础数据变量,如下图。4单击“Statistics”按钮,弹出“

26、Discriminant Analysis: Statistics”对话框,在“Descriptive”栏中选“Means”项,对各组的各变量作均数与标准差的描述;在“Function Coefficients”栏中选“Unstandardized”项,显示判别方程的非标准化系数。 5单击“Classify”按钮,弹出“Discriminant Analysis: Classification”对话框,在“Plot” 栏选“Combined groups”项,作合并的判别结果分布图;在“Display”栏选“Results for each case”项,对原始资料根据建立的判别方程作逐一回代重判别,同时选“Summary table”项,对这种回代判别结果进行总结评价。6单击“Save”按钮,弹出“Discriminant Analysis: Save New Variables”对话框,选择“Predicted group membership”项,将回代判别的结果存入原始数据库中。7单击“OK”按钮,得到输出结果。四、练习(选做)为研究舒张期血压和血浆胆固醇对冠心病的作用,某医师测定了5

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1