1、SPSS统计软件实验指导书01SPSS统计软件实验指 导 书2006年9月目 录1. 统计分析与SPSS的应用大纲2. 实验一 SPSS的数据管理3. 实验二 描述性统计分析4. 实验三 均值检验5. 实验四 方差分析6. 实验五 聚类分析和判别分析7. 实验六 因子分析和主成分分析8. 实验七 相关分析和回归分析9. 实验八 非参数检验10. 实验九 绘制统计图11. 实习报告书写格式统计分析与SPSS的应用实验大纲课程编号: 50540044课程名称:统计分析与SPSS的应用英文名称:Statistical analysis and the application of SPSS本大纲主笔
2、人:刘文平一、课程实验课所占学时36学时二、 实验适用专业统计学专业三、 实验的任务、性质和目的统计计算,尤其是多元统计计算往往是十分复杂的,因此需要借助统计软件。本课程实验正是为了使学生系统地学习SPSS这一统计软件,培养学生根据实际问题建立SPSS数据文件、利用SPSS软件提供的各种统计功能进行统计分析,并结合一定专业知识对分析结果给出合理解释的能力,从而为学生以后从事统计分析工作打下基础。 四、 实验方式与基本要求1由授课教师讲清上机实验的基本要求和注意事项;2由授课教师事先布置上机实验的内容,设计要求,操作步骤,并要求学生课前进行准备;3学生集中在机房上机;4要求学生每次完成所布置的任
3、务,提交实验报告。五、 实验项目的设置与内容提要(见表1)六、 考核方式与评分办法1. 实验报告(40%)2. 上机检查(40%)3. 上机考勤(20%)表1序号实验名称内容提要学时专业实验要求实验类别 每组人数1实验一:了解SPSS软件环境;SPSS的数据管理了解SPSS软件的环境以及相关的基本操作操作过程;学会建立数据文件以及对数据进行编辑整理2统计学必修专业52实验二:利用SPSS进行描述性统计分析频数分布分析、描述性统计分析、探索分析和交叉列连表分析2统计学必修专业53实验三:利用SPSS进行均值检验描述统计、单样本T检验、双样本T检验和配对样本T检验2统计学必修专业54实验四:利用S
4、PSS进行方差分析单因素方差分析、多因素方差分析以及协方差分析2统计学必修专业55实验五:利用SPSS进行聚类分析和判别分析系统聚类、k-均值聚类;距离判别、Fisher判别、Bayes判别和逐步判别2统计学必修专业56实验六:利用SPSS进行因子分析和主成分分析因子分析和主成分分析2统计学必修专业57实验七:利用SPSS进行相关分析和回归分析两变量的相关分析、偏相关分析和距离分析;一元线性回归、多元线性回归、曲线回归和非线性迭代回归2统计学必修专业58实验八:利用SPSS进行非参数检验卡方检验、二项分布检验、游程检验、单样本K-S检验、两个独立样本检验、多个独立样本检验、两个相关样本检验和多
5、个相关样本检验2统计学必修专业59实验九:利用SPSS绘制统计图条形图、线形图、面积图、饼图、散点图、高低图、直方图、P-P概率图、Q-Q概率图及时间序列图2统计学必修专业5 实验一 SPSS的数据管理一、 实验目的1 熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;2掌握SPSS的数据管理功能。二、 实验内容及步骤(一) 实验内容(二) 实验步骤实验三 均值检验一、 实验目的学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。二、 实验内容及步骤(一)描述统计(Means过程)实验内容:某医师测得血红蛋白值(g%)如表3.1,试利用Means过程作基本的描述性统计分析。表
6、3.1对象编号性别年龄血红蛋白值对象编号性别年龄血红蛋白值1234567891011121314151617181920女男女女男男女男女女男男男女女女男男女男181618171618161818171818161717171716161812.8315.5012.2510.0610.889.658.3611.668.547.7813.6610.5712.569.878.9911.3514.5612.408.0514.032122232425262728293031323334353637383940女男男女女女女男男男男女女女男男男男女男161618181718171616181616181
7、818181717161611.3612.7815.098.678.5612.5611.5614.677.8812.3513.659.8710.0912.5516.0413.7811.6710.988.7811.35实验步骤:1建立数据文件。定义4个变量:ID、Gender、Age和HB,分别表示编号、性别、年龄和血红蛋白值。2. 选择菜单“AnalyzeCompare MeansMeans”,弹出“Means”对话框。在对话框左侧的变量列表中,选择变量“血红蛋白值”进入“Dependent List”列表框,选择变量“性别”进入“Independent List”,单击“Next”按钮,选择
8、变量“年龄”进入“Independent List”。3单击“Options”按钮,在弹出的“选择描述统计量”对话框中设置输出的描述统计量。4单击“OK”按钮,得到输出结果。(二)单样本T检验(One-Sample T Test过程)实验内容:某地区10年测得16-18岁人口的平均血红蛋白值为10.25。现在抽查测量了该地区40个16-18岁人口的血红蛋白如表1,试分析该地区现在16-18岁人口的血红蛋白与10年前相比,是否有显著的差异?实验步骤: 1打开数据文件。2. 选择菜单“AnalyzeCompare MeansOne-Sample T Test”。弹出“One-Sample T Te
9、st”对话框。 3在对话框左侧的变量列表中选择变量“血红蛋白”进入“Test Variable(s)” 框;在“Test Value” 编辑框中输入过去的平均血红蛋白值10.25. 4单击“OK”按钮,得到输出结果。(三)双样本T检验(Independent-Samples T Test过程)实验内容:分别测得14例老年性慢性支气管炎病人及11例健康人的尿中17酮类固醇排出量(mg/dl)如下,试比较两组均数有无差别。病 人2.90 5.41 5.48 4.60 4.03 5.10 4.97 4.24 4.36 2.72 2.37 2.09 7.10 5.92健康人5.18 8.79 3.14
10、 6.46 3.72 6.64 5.60 4.57 7.71 4.99 4.01实验步骤: 1建立数据文件。 定义变量名:把实际观察值定义为x,再定义一个变量group来区分病人与健康人。输入原始数据,在变量group中,病人输入1,健康人输入2。 2. 选择菜单“AnalyzeCompare MeansIndependent-samples T Test”项,弹出“Independent- samples T Test”对话框。从对话框左侧的变量列表中选x,进入“Test Variable(s)”框,选择变量“group”,进入“Grouping Variable”框,点击“Define G
11、roups”钮弹出“Define Groups”定义框,在Group 1中输入1,在Group 2中输入2。3单击“OK”按钮,得到输出结果。(四)成对样本T检验(Paired-Samples T Test过程)实验内容:某单位研究饲料中缺乏维生素E与肝中维生素A含量的关系,将大白鼠按性别、体重等配为8对,每对中两只大白鼠分别喂给正常饲料和维生素E缺乏饲料,一段时期后将之宰杀,测定其肝中维生素A含量(mol/L)如下,问饲料中缺乏维生素E对鼠肝中维生素A含量有无影响?大白鼠对别肝中维生素A含量(mol/L)正常饲料组维生素E缺乏饲料组1234567837.220.931.441.439.839
12、.336.131.925.725.118.833.534.028.326.218.3实验步骤:1建立数据文件。 定义变量名:正常饲料组测定值为x1,维生素E缺乏饲料组测定值为x2,输入原始数据。2选择菜单“AnalyzeCompare MeansPaired-samples T Test”项,弹出“Paired - samples T Test”对话框。从对话框左侧的变量列表中选择变量x1、x2进入Variables框。 3单击“OK”按钮,得到输出结果。实验四 方差分析一、 实验目的学习利用SPSS进行单因素方差分析、多因素方差分析和协方差分析。二、 实验内容及步骤(一) 单因素方差分析(O
13、ne-Way ANOVA过程)实验内容:某城市从4个排污口取水,进行某种处理后检测大肠杆菌数量,单位面积内菌落数如下表所示,请分析各个排污口的大肠杆菌数量是否有差别。排污口1234大肠杆菌数量9,12,7,520,14,18,1212,7,6,1023,13,16,21实验步骤: 1建立数据文件。定义变量名:编号、大肠杆菌数量和排污口的变量名分别为x1、x2、x3,之后输入原始数据。2. 选择菜单“AnalyzeCompare MeansOne-way ANOVA”,弹出单因素方差分析对话框。从对话框左侧的变量列表中选择变量” 大肠杆菌数量”,使之进入“Dependent List”列表框;选
14、择“排污口”进入“Factor”框。 3选择进行各组间两两比较的方法。单击“Post Hoc”,弹出“One-Way ANOVA: Post Hoc Multiple Comparisons”。在 “Equal Variances Assumed”复选框组中选择LSD. 4定义相关统计选项以及缺失值处理方法。单击“Options”按钮,弹出“One-Way ANOVA: Options”对话框。在 “Statistics”复选框组选择Descriptive 和Homogeneity-of-variance.同时选中 “Means plot”复选框。 5单击“OK”按钮,执行单因素方差分析,得到
15、输出结果。(二) 多因素方差分析(Univariate过程)实验内容:某城市从4个排污口取水,经两种不同方法处理后,检测大肠杆菌数量,单位面积内大肠杆菌数量如下表所示,请检验它们是否有差别。排污口1234处理方法19,12,7,520,14,18,1212,7,6,1023,13,16,21处理方法213,7,10,817,10,9,1511,5,7,618,14,19,11实验步骤:1建立数据文件。定义变量名:编号、大肠杆菌数量、处理方法和排污口的变量名分别为x1、x2、x3和x4,之后输入原始数据。2. 选择菜单“Analyze General Linear Model Univariat
16、e”,弹出“多因素方差分析”对话框。在对话框左侧的变量列表中选择变量“大肠杆菌数量”进入“Dependent Variable”框,选择“排污口”和“处理方法”进入“Fixed Factor(s)”框。3选择建立多因素方差分析的模型。单击“Univariate”对话框中的“Model”按钮,弹出“Univariate: Model”对话框。选中 “Full Factorial”单选纽即饱和模型。 4设置多因素变量的各组差异比较。单击“Contrasts”按钮,弹出“Univariate: Contrasts”对话框,在 “Contrasts”下拉框中选择Simple;单击“Change”按钮可
17、改变多因素变量的各组差异比较类型。 5设置以图形方式展现多因素之间是否存在交互作用。单击“Plots”按钮,弹出“Univariate:Profile Plots”对话框。选择变量“排污口”进入“Horizontal Axis”编辑框,单击“ADD”进入“Plots”框后,选择变量“处理方法”进入“Horizontal Axis”编辑框, 单击“ADD”进入“Plots”框。 6设置均值多重比较类型。单击“Post Hoc”按钮,弹出“Univariate: Post Hoc Multiple Comparisons for Observed Means”对话框。将因素“排污口”选入“Post
18、 Hoc Test for”列表框,进行多重比较分析。在“Equal Variances Assumed”复选框组中,选择LSD法进行方差齐时两两均值的比较。 7设置输出到结果窗口的选项。单击“Options”按钮,弹出“Univariate:Options”对话框,在“Display”复选框中选择Descriptive statistics和Homogeneity tests. 8单击“OK”按钮,执行多因素方差分析,得到输出结果。(三) 协方差分析(Univariate过程)实验内容: 政府实施某个项目以改善部分年轻工人的生活状况。项目实施后开始对年轻工人生活的改善情况进行调查,调查项目包
19、括工人受教育程度、是否实施了该项目、实施项目前的工资(前工资)和实施项目后的工资(后工资)如下表所示。用实施项目后的工资来反映生活状况的改善,要求剔除实施项目前的工资差异,分析工人的受教育程度和该项目实施对工人收入的提高是否有显著的影响。编号前工资后工资受教育程度项目实施编号前工资后工资受教育程度项目实施1812初中否16812初中否2810高中否17810高中否3811初中否18811初中否4918初中是19918初中是5712初中否20712初中否6815初中是21815初中是7813高中否22813高中否8922初中是23922初中是9718初中是24718初中是1079初中否2578初
20、中否1168初中否26812初中否121020高中是27815初中否13614初中是28913高中否14816初中是291114大学否151225大学否30614初中是实验步骤:1 建立数据文件。定义5个变量:x1、x2、x3、x4和x5,分别表示编号、前工资、后工资、受教育程度和项目实施。注意:这5个变量都应是数值型的。2选择菜单“AnalyzeGeneral Linear ModelUnivariate”,弹出“多因素方差分析”对话框。3选择进行协方差分析的变量。在对话框左侧的变量列表中选择变量“后工资”进入“Dependent Variable”框;选择变量“受教育程度”和“项目实施”进
21、入“Fixed Factor(s)”框;选择变量“前工资”进入“Covariate(s)”框。4选择建立多因素方差分析的模型。单击“Model”按钮,弹出“Univariate:Model”对话框,选择饱和模型。5其他设置与多因素方差分析类似,在此略。6单击“OK”按钮,执行协方差分析,得到输出结果。实验五 聚类分析和判别分析一、 实验目的学习利用SPSS进行聚类分析和判别分析。二、实验内容及实验步骤(一)系统聚类法(Hierarchical Cluster过程)实验内容:29名儿童的血红蛋白(g/100ml)与微量元素(g/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望
22、通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。编号N0.钙X1镁X2铁X3锰X4铜X5血红蛋白X6123456789101112131415161718192021222324252627282954.8972.4953.8164.7458.8043.6754.8986.1260.3554.0461.2360.1769.6972.2855.1370.0863.0548.7552.2852.2149.7161.0253.6850.2265.3456.3966.1273.8947.3130.8642.6152.8639.1837.6726.1830.8643.7
23、938.2034.2337.3533.6740.0140.1233.0236.8135.0730.5327.1436.1825.4329.2728.7929.1729.9929.2931.9332.9428.55448.70467.30425.61469.80456.55395.78448.70440.13394.40405.60446.00383.20416.70430.80445.80409.80384.10342.90326.29388.54331.10258.94292.80292.60312.80283.00344.20312.50294.70 0.012 0.008 0.004 0
24、.005 0.012 0.001 0.012 0.017 0.001 0.008 0.022 0.001 0.012 0.000 0.012 0.012 0.000 0.018 0.004 0.024 0.012 0.016 0.048 0.006 0.006 0.016 0.000 0.064 0.0051.0101.6401.2201.2201.0100.5941.0101.7701.1401.3001.3800.9141.3501.2000.9181.1900.8530.9240.8171.0200.8971.1901.3201.0401.0301.3500.6891.1500.8381
25、3.5013.0013.7514.0014.2512.7512.5012.2512.0011.7511.5011.2511.0010.7510.5010.2510.00 9.75 9.50 9.25 9.00 8.75 8.50 8.25 8.00 7.80 7.50 7.25 7.00实验步骤:1建立数据文件。定义变量名:钙、镁、铁、锰、铜和血红蛋白的变量名分别为x1、x2、x3、x4、x5、x6,之后输入原始数据。2选择菜单“AnalyzeClassifyHierarchical Cluster”,弹出Hierarchical Cluster Analysis对话框。从对话框左侧的变量列表
26、中选x1、x2、x3、x4、x5、x6,使之进入Variable(s)框;在Cluster处选择聚类类型Variables(对变量聚类),如下图。 3单击“Statistics”按钮,弹出“Hierarchical Cluster Analysis: Statistics”对话框,选择“Proximity matrix”以显示距离矩阵。 4单击“Plots”按钮,弹出“Hierarchical Cluster Analysis: Plots”对话框,选择Dendrogram项。5单击“Method”按钮,弹出“Hierarchical Cluster Analysis: Method”对话框,
27、选择“Between-groups linkage”和“Pearson correlation” 。 6单击“OK”按钮,得到输出结果。(二)快速聚类法(K-Means Cluster过程) 实验内容: 为研究儿童生长发育的分期,调查1253名1月至7岁儿童的身高(cm)、体重(kg)、胸围(cm)和坐高(cm)资料。资料作如下整理:先把1月至7岁划成19个月份段,分月份算出各指标的平均值,将第1月的各指标平均值与出生时的各指标平均值比较,求出月平均增长率(%),然后第2月起的各月份指标平均值均与前一月比较,亦求出月平均增长率(%),结果见下表。欲将儿童生长发育分为四期,故指定聚类的类别数为4,请通过聚类分析确定四个儿童生长发育期的起止区间。月份月平均增长率(%)身高
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1