实验八非参数假设检验.docx
《实验八非参数假设检验.docx》由会员分享,可在线阅读,更多相关《实验八非参数假设检验.docx(10页珍藏版)》请在冰豆网上搜索。
实验八非参数假设检验
实验八非参数假设检验
⏹单样本非参数检验
⏹两个独立样本非参数检验
⏹多个独立样本非参数检验
⏹两个配对样本非参数检验
⏹多个配对样本非参数检验
一、单样本非参数检验
选择:
分析Analyze==>非参数检验NonparametricTests==>……
1、基本功能
对单个总体的分布形态进行推断的方法。
其中方法包括:
卡方检验、二项分布检验、K-S检验以及变量值随机性检验等。
2、方法简介
2.1卡方检验
✓卡方检验可以进行拟合优度的检验,即可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,可检验样本是否服从正态、均匀、Poisson等分布。
卡方检验是一种吻合性检验,通常适用于多项分类值总体分布的分析。
✓零假设H0:
样本来自的总体分布与期望分布或某一理论分布无显著差异。
✓操作步骤
1、选择分析Analyze==>非参数检验NonparametricTests==>χ2检验Chi-Square;
2、将待检验的变量选择到TestVariable框;
3、在ExpectedRange框选项中确定参与分析的样本范围,其中Getfromdata表示所有样本都参与分析;UseSpecifiedRange表示只有在取值范围内的样本才参与分析;
4、在ExpectedValues框中给出各个pi值,其中Allcategoriesequal表示所有子集的pi都相同,即期望分布为均匀分布;Value框后可依次输入pi值,并可单击进行增加、修改和删除。
2.2二项分布检验
✓二项分布检验是要通过样本数据检验样本来自的总体是否服从指定的概率值为p的二项分布。
✓零假设H0:
样本来自的总体与指定的二项分布无显著差异。
✓操作步骤
1、选择分析Analyze==>非参数检验NonparametricTests==>二项式Binomial;
2、将待检验的变量选择到TestVariableList框;
3、在DefineDichotomy框中指定如何分类,如果检验变量为二值变量,则选Getfromdata选项;如果检验变量不是二值变量,则可在CutPoint框后输入具体数值,小于等于该值的观察值为第一组,大于该值的为第二组;
4、在Test框中输入二项分布的检验概率值p。
至此,SPSS将自动将第一组作为检验类,检验该类出现的概率是否与输入的检验概率值存在显著差异
2.3单样本K-S检验
✓单样本K-S检验是以俄罗斯数学家柯尔莫哥洛夫和斯米尔诺夫命名的一种非参数检验方法。
是一种拟合优度性检验。
✓该方法利用样本数据推断样本来自的总体是否服从某一理论分布,这种检验可以确定是否有理由认为样本的观察结果来自该理论分布的总体。
✓适用于探索连续型随机变量的分布。
✓零假设H0:
样本来自的总体分布与指定的理论分布无显著差异。
✓SPSS的理论分布主要包括:
正态分布、均匀分布、指数分布和泊松分布。
✓操作步骤
1、选择分析Analyze==>非参数检验NonparametricTests==>单样本K-S检验1-SampleK-S;
2、将待检验的变量选择到TestVariableList框;
3、在TestDistribution框中选择理论分布,其中Normal为正态分布,Uniform为均匀分布,Poisson为泊松分布,Exponential为指数分布。
至此,SPSS将自动计算K-S检验统计量和对应的概率p值,并将结果显示到输出窗口中。
2.4变量值随机性检验
✓变量值随机性检验通过对样本变量值的分析,实现对总体变量值出现是否随机进行检验。
也称为游程检验。
✓零假设H0:
总体变量值出现是随机的。
✓操作步骤
1、选择分析Analyze==>非参数检验NonparametricTests==>游程检验Runs;
2、将待检验的变量选择到TestVariableList框;
3、在CutPoint框中确定计算游程数的分界值,其中Median表示以样本中位数为分界值;Mode表示以样本众数为分界值,Mean表示以样本均值为分界值,Custom表示以用户输入的值为分界值。
SPSS将小于该分界值作为一组,将大于或等于该分界值得所有变量值作为另一组,然后计算游程数。
至此,SPSS将自动计算游程数、检验统计量和对应的概率p值,并将结果显示到输出窗口中。
二、两独立样本非参数检验
选择:
分析Analyze==>非参数检验NonparametricTests==>两独立样本检验2IndependentSamples
1、基本功能
对两独立样本是否具有相同的分布进行推断的方法。
其中方法包括:
曼-惠特尼U检验、K-S检验、W-W游程检验和极端反应等等。
2、方法简介
零假设H0:
两组独立样本来自的两总体分布无显著差异;
2.1曼-惠特尼U检验
✓曼-惠特尼U检验可通过对两组样本平均秩的研究来实现推断;
✓秩简单说就是变量值排序的名次;
2.2两独立样本的K-S检验
✓与单样本K-S检验的基本思路大体一致,主要差别在于:
这里是以变量值的秩作为分析对象,而非变量值本身。
2.3两独立样本的游程检验
✓与单样本K-S检验的基本思路大体一致,不同的是计算游程数的方法。
两独立样本的游程检验中,游程数依赖于秩。
2.4两独立样本的极端反应检验(MosesExtremeReactions)
⏹极端反应检验的基本思想是,将一组样本作为控制样本,另一组样本作为实验样本。
以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。
✓如果实验样本没有出现极端反应,则认为两总体分布无显著差异;
✓相反,如果实验样本存在极端反应,则认为两总体分布存在显著差异。
3、操作步骤
准备工作:
设置两个变量,一个变量存放样本值,另一个存放组标记值。
1、选择分析Analyze==>非参数检验NonparametricTests==>两独立样本检验2IndependentSamples;
2、将待检验的变量选择到TestVariableList框;
3、把存放组标志的变量指定到GroupingVariable框中,并单击DefineGroups按钮,给出两组的组标记值。
4、在TestType框中选择采用的检验方法。
至此,SPSS将根据用户的选择进行检验,并将结果显示到输出窗口中。
三、多个独立样本非参数检验
选择:
分析Analyze==>非参数检验NonparametricTests==>多个独立样本的检验KIndependentSamples
1、基本功能
通常用来检验几个独立样本是否来自同一总体的参数方法。
其中方法包括:
中位数检验、Kruskal-Wallis检验和Jhnckheere-Terpstra等等。
2、方法简介(略)
零假设H0:
多个独立样本来自的多个总体分布(或中位数)无显著差异;
3、操作步骤
准备工作:
设置两个变量,一个变量存放样本值,另一个存放组标记值。
1、选择分析Analyze==>非参数检验NonparametricTests==>多个独立样本的检验KIndependentSamples;
2、将待检验的变量选择到TestVariableList框;
3、把存放组标志的变量指定到GroupingVariable框中,并单击DefineGroups按钮,给出两组的组标记值。
4、在TestType框中选择采用的检验方法。
至此,SPSS将根据用户的选择进行检验,并将结果显示到输出窗口中。
四、两相关(配对)样本非参数检验
选择:
分析Analyze==>非参数检验NonparametricTests==>两相关(配对)样本的检验2Related(Paired)Samples
1、基本功能
是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。
其中方法包括:
McNemar检验、符号检验和Wilcoxon符号秩检验等等。
2、方法简介(略)
零假设H0:
两配对样本来自的两总体的分布无显著差异;
3、操作步骤
准备工作:
设置两个变量,分别存放两组样本的样本值。
1、选择分析Analyze==>非参数检验NonparametricTests==>两相关(配对)样本的检验2Related(Paired)Samples;
2、将待检验的两个配对变量选择到TestVariableList框;
3、在TestType框中选择采用的检验方法。
至此,SPSS将根据用户的选择进行检验,并将结果显示到输出窗口中。
五、多个相关(配对)样本非参数检验
选择:
分析Analyze==>非参数检验NonparametricTests==>K个相关(配对)样本的检验KRelated(Paired)Samples
1、基本功能
多配对样本的非参数检验是通过分析多组配对样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。
其中方法包括:
Friedman检验、CochranQ检验和Kendall协同系数检验等等。
2、方法简介(略)
零假设H0:
多个配对样本来自的多个总体的分布无显著差异;
注:
多配对样本的CochranQ检验适合于二值品质型数据的分析。
3、操作步骤
准备工作:
有多少组样本,就应设置多少个变量,分别存放各组样本的样本值。
1、选择分析Analyze==>非参数检验NonparametricTests==>k个相关(配对)样本的检验KRelated(Paired)Samples;
2、将待检验的多个配对变量选择到TestVariableList框;
3、在TestType框中选择采用的检验方法。
至此,SPSS将根据用户的选择进行检验,并将结果显示到输出窗口中。
案例1:
为研究心脏病人猝死人数与日期的关系,收集到168个观察数据,其中星期一至星期日的死亡人数分别为55,23,18,11,26,20,15,并用数字1至7表示星期数,现在利用这批样本数据,推断心脏病人猝死人数与日期的关系是否为2.8:
1:
1:
1:
1:
1:
1。
提示:
需定义一个存放变量值的SPSS变量和一个存放各变量值观测频数的变量,并指定该变量为加权变量。
案例2:
产品合格率检验
为验证某批产品的一级品率是否为90%,现从该批产品中随机抽取23个样品进行检测并得到检测结果数据。
其中1表示一级品,0表示非一级品。
提示:
这里采用二项分布检验方法检验。
由于是小样本,SPSS将自动计算精确概率。
案例3:
储户对未来收入看法的检验
根据第2章居民储蓄的样本数据,分析储户对未来收入的看法,检验储户总体对收入持保守或悲观态度(a3变量的取值为2和3)的比例是否为0.4,持乐观态度(a3变量的取值为1)的比例是否为0.6。
提示:
这里采用二项分布检验方法检验。
由于是大样本,SPSS将采用近似计算法,得到Z检验统计量的概率p值。
案例4:
周岁儿童身高总体的分布检验
利用收集到的21名周岁儿童身高的样本数据,采用K-S方法检验周岁儿童身高的总体是否服从正态分布。
案例5:
储户存(取)款金额总体的分布检验
利用K-S检验分析储户一次存(取)款金额的总体是否服从正态分布。
提示:
●可以结合存(取)款金额的P-P图和Q-Q图做直观观察;
●P-P图和Q-Q图本质都是一种散点图;
●P-P图中,横轴为样本数据实际累计概率值,纵轴为期望(理论)累积概率值,当数据与理论分布完全一致时,各个数据点应落在中间的对角线上;
●Q-Q图中,横轴仍为实际累积概率值,纵轴是实际累积概率值与期望(理论)累积概率值的差。
如果数据与理论分布无显著差异,则图中的点应随机分散在0横线的附近。
案例6:
为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间点上的设备耐压的数据。
现采用游程检验方法对单样本游程—电缆.sav进行分析。
如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。
提示:
指定以中位数作为分界值。
案例7:
两种生产工艺下产品使用寿命的比较分析
从甲乙两种不同工艺生产出来的产品中随机选取若干个样本(数据如前),分析两种工艺产品的使用寿命是否存在显著差异。
分析:
由于对产品的使用寿命的分布没有明确的把握,因此可采用非参数检验的方法进行分析。
这里涉及到两个独立样本,因此采用两独立样本的非参数检验方法,并分别选择上述四种方法进行分析。
案例8:
城镇和农村储户存(取)款金额的比较
利用第2章居民储蓄调查数据,对城镇和农村储户存(取)款金额的分布进行比较分析。
分析:
这里采用两独立样本的非参数检验方法进行分析。
其中,存(取)款金额为待分析的变量,户口为组标记变量。
分别选择上述四种方法进行分析。
案例9:
四城市周岁儿童身高的分析比较
从北京、上海、成都、广州四城市中随机选取若干个周岁儿童身高的样本(数据如前),分析四城市周岁儿童的身高是否存在显著差异。
分析:
由于对身高的分布没有明确的把握,因此可采用非参数检验的方法进行分析。
这里涉及到多个独立样本,因此采用多独立样本的非参数检验方法,并分别选择上述三种方法进行分析。
案例10:
不同职业储户存(取)款金额的比较
利用第2章居民储蓄调查数据,对不同职业储户存(取)款金额的分布进行比较分析。
分析:
这里采用多独立样本的非参数检验方法进行分析。
其中,存(取)款金额为待分析的变量,职业为组标记变量。
分别选择上述三种方法进行分析。
案例11:
学习《统计学》前后对统计学重要性认知程度的检验
利用两配对样本-统计学数据,采用两配对样本McNemar检验进行分析。
案例12:
新的训练方法能否提高跳远运动员成绩
利用两配对样本-训练成绩数据,采用两配对样本的符号检验和两配对样本的Wilcoxon符号秩检验进行分析。
案例13:
不同促销形式是否对销售额产生了显著影响
利用多配对样本-促销方式数据,采用多配对样本Friedman检验进行分析。
案例14:
分析三家航空公司的服务水平是否存在显著差异
利用多配对样本-航空公司数据,采用多配对样本的CochranQ检验进行分析。
案例15:
分析评委的评分标准是否一致
利用评委给歌手打分的数据,采用多配对样本的Kendall协同系数检验进行分析。