SPSS描述统计PPT推荐.ppt
《SPSS描述统计PPT推荐.ppt》由会员分享,可在线阅读,更多相关《SPSS描述统计PPT推荐.ppt(177页珍藏版)》请在冰豆网上搜索。
进行不同次抽样,会得到若干个不同的样本均值,它们与总体均值存在着不同的差异。
均值标准误差(StandardErrorofMean,S.E.mean)就是描述这些样本均值与总体均值之间平均差异程度的统计量。
3.1.2SPSS中实现过程,研究问题求某班级学生在一次数学测验中的平均成绩,数据如表3-1所示。
表3-1某班级的数学成绩,实现步骤,图3-1在菜单中选择“Frequencies”命令,图3-2“Frequencies”对话框
(一),图3-3“Frequencies:
Statistics”对话框
(一),3.1.3结果和讨论,3.2中位数(Median),3.2.1统计学上的定义和计算公式,定义:
把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。
它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。
计算公式:
一个大小为的数列,要求其中位数,首先应把该数列按大小顺序排列好,如果为奇数,那么该数列的中位数就是位置上的数;
如果N为偶数,中位数则是该数列中第与第+1位置上两个数值的平均数。
3.2.2SPSS中实现过程,研究问题求某班级学生身高的中位数,数据如表3-2所示。
表3-2某班级学生的身高,实现步骤,图3-4“Frequencies:
Statistics”对话框
(二),3.2.3结果和讨论,3.3众数(Mode),3.3.1统计学上的定义和计算公式,定义:
众数是指一组数据中,出现次数最多的那个变量值。
众数在描述数据集中趋势方面有一定的意义。
例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。
计算公式:
手工计算众数比较麻烦,需要统计数据的次数分布。
3.3.2SPSS中实现过程,研究问题求某医院当天出生新生儿的体重的众数,数据如表3-3所示。
表3-3新生儿的体重,实现步骤,图3-5“Frequencies:
Statistics”对话框(三),3.3.3结果和讨论,3.4.1统计学上的定义和计算公式,3.4全距(Range),定义:
全距也称为极差,是数据的最大值与最小值之间的绝对差。
在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。
最大值最小值。
3.4.2SPSS中实现过程,研究问题求某班级学生数学成绩的全距,数据如表3-4所示。
表3-4某班级的数学成绩,实现步骤,图3-6“Frequencies:
Statistics”对话框(四),3.4.3结果和讨论,3.5.1统计学上的定义和计算公式,3.5方差(Variance)和标准差(StandardDeviation),定义:
方差是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。
标准差是方差的平方根,它表示了一组数据关于平均数的平均离散程度。
方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。
3.5.2SPSS中实现过程,研究问题求某班级学生数学成绩的方差和标准差,数据如表3-1所示。
实现步骤,图3-7在菜单中选择“Descriptives”命令,图3-8“Descriptives”对话框
(一),图3-9“Descriptives:
Options”对话框
(一),3.5.3结果和讨论,3.6四分位数(Quartiles)、十分位数(Deciles)和百分位数(Percentiles),3.6.1统计学上的定义,定义:
四分位数是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。
其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。
四分位差越小,说明中间的数据越集中;
四分位数越大,则意味着中间部分的数据越分散。
十分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为D1,D2,D9,表示10%的数据落在D1下,20%的数据落在D2下,90%落在D9下。
百分位数是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,P99,表示1%的数据落在P1下,2%的数据落在P2下,99%落在P99下。
3.6.2SPSS中实现过程,研究问题1求某班级学生数学成绩的四分位数,数据如表3-1所示。
实现步骤,图3-10“Frequencies:
Statistics”对话框(五),研究问题2测量54个某种机械零件的重量(克),求零件重量的D6,数据如表3-5所示。
表3-5零件的重量,实现步骤,图3-11“Frequencies:
Statistics”对话框(六),图3-12“Frequencies:
Statistics”对话框(七),研究问题3测量出54个某种机械零件的重量(克),求零件重量的P37,数据如表3-5所示。
实现步骤,图3-12“Frequencies:
Statistics”对话框(七),3.6.3结果和讨论,研究问题1的程序运行结果如下表所示。
研究问题2的程序运行结果如下表所示。
研究问题3的程序运行结果如下表所示。
3.7频数(Frequency),3.7.1统计学上的定义和计算公式,定义:
频数就是一个变量在各个变量值上取值的个案数。
如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。
变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。
3.7.2SPSS中实现过程,研究问题10个学生在某次数学、语文、化学考试中成绩如表3-6所示,试求学生在3门课程上的频数分布。
表3-6学生成绩,实现步骤,图3-13“Frequencies”对话框
(二),3.7.3结果和讨论,程序运行结果如下表所示。
3.8峰度(Kurtosis),3.8.1统计学上的定义和计算公式,定义:
峰度是描述某变量所有取值分布形态陡缓程度的统计量。
这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;
峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;
峰度小于0表示比正态分布的高峰要平坦,为平顶峰。
具体的计算公式为,3.8.2SPSS中实现过程,研究问题某班级40个学生的年龄分布如表3-7所示,试求学生年龄峰度。
表3-7学生年龄,实现步骤,图3-14在Data菜单中选择“WeightCases”命令,3.8.3结果和讨论,3.9偏度(Skewness),3.9.1统计学上的定义和计算公式,定义:
偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。
具体的计算公式为,这个统计量是与正态分布相比较的量,偏度为0表示其数据分布形态与正态分布偏度x相同;
偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;
偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。
而偏度的绝对值数值越大表示分布形态的偏斜程度越大。
3.9.2SPSS中实现过程,研究问题某班级41个学生的身高分布如表3-8所示,试求学生身高分布偏度。
表3-8学生身高,实现步骤,图3-17“Frequencies:
Statistics”对话框(九),3.9.3结果和讨论,3.10标准化Z分数及其线性转换,3.10.1统计学上的定义和计算公式,3.10.2SPSS中实现过程,研究问题1求某班级学生数学成绩的Z分数,数据如表3-1所示。
实现步骤,图3-18“Descriptives”对话框
(二),图3-19“Descriptives:
Options”对话框
(二),图3-20数据编辑窗口,研究问题2从图3-20中可以看到学生数学成绩的Z分数有正有负,而且小数点位数较多,因此可以把它线性转换为T分数。
实现步骤,图3-21在菜单中选择“ComputeVariable”命令,图3-22“ComputeVariable”对话框,图3-23“ComputeVariable:
Type”对话框,图3-24数据编辑窗口,3.10.3结果和讨论,从Z分数(图3-20)和T分数(图3-24)的结果中可以看出此班级学生数学成绩的T分数比之前的Z分数简洁多了,比较起来一目了然。
3.11探索分析,3.11.1统计学上的定义和计算公式,定义:
调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。
它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,有助于用户思考对数据进行进一步分析的方案。
1探索分析的内容包括下面几个方面,检查数据是否有错误:
过大或过小的数据均有可能是奇异值、影响点或错误数据。
要找出这样的数据,并分析原因,然后决定是否从分析中删除这些数据。
因为奇异值和影响点往往对分析的影响较大,不能真实反映数据的总体特征。
对数据规律的初步观察:
通过初步观察获得数据的一些内部规律,例如,两个变量间是否线性相关。
2探索分析的考察方法,探索分析一般通过数据文件在分组与不分组的情况下,获得常用统计量和图形。
一般以图形方式输出,直观帮助用户确定奇异值、影响点、进行假设检验,以及确定用户要使用的某种统计方式是否合适。
3正态分布检验,常用的正态分布检验是Q-Q图。
本例中进行了正态分布检验。
4方差齐次性检验,对数据分析不仅需要进行正态分布检验,有时候还需要比较各个分组的方差是否相同,这就要进行方差齐次性检验。
例如,在进行独立右边的T检验之前,就需要事先确定两个数据的方差是否相同。
如果通过分析发现各个方差不同,还需要对数据进行方差分析,那么就需要对数据进行转换使得方差尽可能相同。
在探索分析中可以使用Levene检验。
Levene检验对数据进行方差齐次性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。
如果得到显著性水平小于0.05,那么就可以拒绝方差相同的假设。
3.11.2SPSS中实现过程,研究问题20名10岁少儿的身高(cm)资料,数据如表3-9所示,试作探索性分析。
表3-9身高数据,实现步骤,图3-25在菜单中选择“Explore”命令,图3-26“Explore”对话框,图3-27“Explore:
Statistics”对话框,图3-28“Explore:
Plots”对话框,图3-29“Explore:
Options”对话框,3.11.3结果和讨论,在结果输出窗口中将看到如下统计数据。
(1)首先输出如下个案观察量摘要表,如下表所示。
(2)然后输出如下表格。
(3)接着输出如下4个不同权重下作中心趋势的粗略最大似然确定数,,(