1、1频数分析(Frequencies)实验数据1:表2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。表2.7 某班16位学生的身高数据学号性别身高(cm)1M17091502F17310157316911177415512160517413617814154715615172817116180基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。比如,在某项调查中,想要知道被调查者的性别分布状况。频数分析的第一个基本任务是编制频数分布表。SPSS中的频数分布表包括的内容有:(1)频数(Frequency)即变量值落在某个
2、区间中的次数。(2)百分比(Percent)即各频数占总样本数的百分比。(3)有效百分比(Valid Percent)即各频数占有效样本数的百分比。这里有效样本数总样本缺失样本数。(4)累计百分比(Cumulative Percent)即各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的第二个基本任务是绘制统计图。统计图是一种最为直接的数据刻画方式,能够非常清晰直观地展示变量的取值状况。频数分析中常用的统计图包括:条形图,饼图,直方图等。频数分析的应用步骤:在SPSS中的频数分析的实现步骤如下:选择菜单“【文件】【打开】【数据】”在对话框中的文件类型选项中选择所有文件,找到需要分析的数
3、据文件“SPSS数据/学生身高数据.xls”,然后选择“打开”。如图1.1所示。图2.1 打开数据 选择菜单“【分析】【描述统计】【频率】”。如图2.2所示图2.2 频率确定所要分析的变量,例如身高。在变量选择确定之后,在同一窗口上,点击“统计量”按钮,打开统计量对话框,如下图2.3所示,选择统计输出选项。 图2.3 统计量子对话框表2.1 描述性统计量统计量N有效缺失表2.2 Gender频数分布表频率百分比有效百分比累积百分比6.312.518.825.031.337.550.056.362.568.875.081.387.593.8100.0合计图2.4 变量身高的条形图 图2.5 变量
4、身高的饼图图2.6 变量身高的直方图结果分析:由实验结果可知,该班学生的平均身高为166.56cm,其中身高为169cm的同学数量最多,身高的标准偏差为9.668cm,根据直方图可得,该班学生的身高分布不均。2.描述统计(Descriptives)试验数据2:测量18台电脑笔记重量,见表2.8,对其进行描述统计量分析,并对试验结果作出说明。表2.8 18台笔记本电脑重量表序号重量1.751.921.591.851.831.681.891.701.7917181.661.802.051.911.761.88SPSS的【描述】命令专门用于计算各种描述统计性统计量。选择菜单【分析】【描述统计】【描述
5、】,如图2.7所示图2.8 描述对话框将待分析的变量移入描述性列表框,将序号、重量2个变量进行描述性统计,以观察重量与序号的关系。Save standardized values as variables,对所选择的每个变量进行标准化处理,产生相应的Z分值,作为新变量保存在数据窗口中。其变量名为相应变量名前加前缀z。标准化计算公式:图2.9 描述对话框选项单击【选项】按钮,如图2.9 所示,选择需要计算的描述统计量。各描述统计量同Frequencies命令中的Statistics子对话框中大部分相同,这里不再重复。在主对话框中单击ok执行操作。表2.3 描述统计量表描述统计量极小值极大值均值标
6、准差9.505.3391.8083.10777有效的 N (列表状态)结果输出与分析:从实验结果中可以看出,该批次笔记本的平均质量为1.8083kg,而大部分笔记本电脑重量在1.8kg左右,占到了总台数的50%以上。存在个别过轻或者过重的笔记本电脑产品,有可能是不合格产品。实验2 统计推断1.熟悉点估计概念与操作方法2.熟悉区间估计的概念与操作方法3.熟练掌握T检验的SPSS操作4.学会利用T检验方法解决身边的实际问题1.参数估计的基本原理2.假设检验的基本原理三、实验演示内容与步骤 1.单个总体均值的区间估计 例题:某省大学生四级英语测验平均成绩为65,现从某高校随机抽取20份试卷,其分数为
7、:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62,问该校英语水平与全区是否基本一致?设0.05打开SPSS,建立数据文件:“ 某省大学生四级英语测验成绩.sav”。这里,研究变量为:四级英语测验平均成绩成绩,即这20个样本的成绩。选择区间估计选项,方法如下: 选择菜单【分析】【探索】” ,打开图3.1探索对话框。从源变量清单中将“四级英语测验平均成绩”变量移入、因变量列表框中。图3.1 探索对话框 图3.2 探索:计算结果表3.1 案例处理摘要案例四级英语测验平均成绩21100.0%.0%表3.2 描述标准误70.1905
8、2.05243均值的 95% 置信区间下限65.9092上限74.47185% 修整均值70.1561中值70.0000方差88.4629.4054254.0087.00范围33.00四分位距15.00偏度.060.501峰度-.848.972如上表显示。从上表“ 95 Confidence Interval for Mean ”中可以得出区间估计(置信度为95) 为:(65.9092,74.4718),其中lower Bound 表示置信区间的下限,Upper Bound表示置信区间的上限。点估计是:四级英语测验平均成绩 Stem-and-Leaf Plot Frequency Stem &
9、 Leaf 1.00 5 . 4 2.00 5 . 69 4.00 6 . 1224 3.00 6 . 688 3.00 7 . 024 5.00 7 . 56688 1.00 8 . 3 2.00 8 . 57 Stem width: 10.00 Each leaf: 1 case(s)图3.32两个总体均值之差的区间估计分析某班级学生的高考数学成绩是否存在性别上的差异。数据如表所示:某班级学生的高考数学成绩数学成绩男(n18)85 89 75 58 86 80 78 76 84 89 99 95 82 87 60 85 75 80女(n12)92 96 86 83 78 87 70 65
10、70 65 70 78 72 56打开SPSS,按如下图示格式输入原始数据,建立数据文件:“工会会员工资差别.spss”。这里,“会员”表示是否为工会会员的变量,y 表示是工会会员,n表示非工会会员,“报酬”表示女性员工报酬变量,单位:千美元。计算两总体均值之差的区间估计,采用“独立样本T 检验”方法。选择菜单“ 【分析】【比较均值】独立样本T检验”, 打开对话框。计算结果 单击上图中“OK”按钮,输出结果如下图所示。分别给出不同总体下的样本容量、均值、标准差和平均标准误。从该表中可以看出,平均报酬为76.89 组统计量均值的标准误成绩81.277810.368542.4438976.285711.431593.055223单个总体均值的假设检验 (单样本T检验)判断检验类型 该例属于“大样本、总体标准差未知。假设形式为:H0:0, H1 :0软件实现程序 打开已知数据文件,然后选择菜单“【
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1