1、 2、秩和检验 3、游程检验学习重点 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验;学习难点 一、假设检验的基本思路与有关概念;二、两类错误的理解及其关系;第一节 统计检验的基本概念 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理
2、:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其为“实际不可能事件”。 二、假设检验的基本概念 (一)原假设与对立假设 1、原假设:用“ H0:”表示(也称“零假设”、“虚无假设” ) 这是研究者对总体参数事先提出的假设。通常以总体没有发生显著变化为原假设。 2、对立假设:用“H1:”表示 对立假设也称“备择假设” 这是与原假设完全对立的、矛盾的假设,假设总体发生了显著的变化。 (二)显著性水平与显著性差异 1、显著性水平: 在统计检验中,判断假设是否合理,是根据一定的标准来确定的,这个标准是在检验之前由研究者事先主观选定的一个小概率值,用表示.这个就是显著性水平。
3、 常用的有 0.1、0.05或 0.01等 2、显著性差异: 如果统计量和假设的参数值存在差距,有两种可能: (1)差距不是很大(即不在小概率范围内出现),即可认为总体没发生显著变化。可接受原假设。 (2)差距很大(即出现在小概率范围内),即可认为总体发生了显著变化。说明存在着显著性差异,故拒绝原假设。 (三)双侧检验与单侧检验 1、双侧检验(双尾检验): 双侧检验要求同时注意估计值偏高和偏低的倾向,这时,差距不分正负, 给出的显著水平平分在两侧。 接受域 拒绝域 拒绝域 临界点 临界点 2、单侧检验(单尾检验):(有左单侧和右单侧两种) 单侧检验只注意估计值是否偏高(或偏低),它是单方向的,
4、给出的显著性水平集中在同一侧。偏高时,差距为正,为右单侧检验;偏低时,差距为负,为左单侧检验。 (四)两种类型的错误 1、第一类错误 以真为假 此类错误是将原属正确的 H0:错当成不正确的而给予否定了。统计学中称这种错误为错误,属第一类错误,也叫做“弃真错误”。 2、第二类错误 以假为真 此类错误是将原属不正确的 H0:错当成正确的而给予肯定了。统计学中称这种错误为错误,属第二类错误,也叫做“存伪错误”。 在统计检验中,必须做出否定H0:或肯定H0:的抉择,因此,不可避免地可能犯错误或错误。如果减小错误,势必增加犯错误的可能性;而若为了减小错误,错误必然增大。所以,要同时减小犯两类错误的概率,
5、就应增大样本容量。此外,取多大的值,也应取决于所要研究的问题的性质。 (五)拒绝域、接受域和临界值 1、拒绝域:计算结果表明总体发生了显著变化,而没有理由不拒绝原假设的区域。 2、接受域:计算结果表明总体没发生显著变化,从而接受原假设的区域。 3、临界值(临界点):拒绝域与接受域的界限。表示在给定一个显著水平的前提下,假定总体发生显著变化的数值界限。 三、检验中决定使用的概率分布(以平均数的检验为例) 假设检验中使用正态(Z)分布或t 分布的条件条 件总 体 2 已 知总 体 2 未 知大 样 本( n 大于 30 )正态分布( Z 值表)小 样 本(总体为正态或近似正态)t 分布( t 值表
6、) 四、假设检验的程序 1、提出假设 原假设 H0:(以总体未发生显著变化为原假设) 备择假设 H1:(总体发生显著变化) 2、选择一个显著水平 等于对犯第一类错误的概率给出具体数值,通常显著水平用 0.1、0.05或 0.01等。 3、构造一个检验值(选择 Z或 t 分布) 或 4、作出判断 根据统计量 Z(或 t )的计算结果,看其是落在接受区域或者落在拒绝区域而作出接受或拒绝原假设的决定。第二节 总体参数检验 一、总体平均数的检验 (一)总体标准差已知 1、双侧检验 例52.1 一个生产车轴的工厂,其生产的车轴必须能承受5 600千克/cm2的压力;而如果过分坚硬则务必要增加成本。多年来
7、的经验表明,该厂的车轴硬度标准差是 250 千克/ cm2 。工厂从最近的生产线上抽出100根车轴进行检验,得样本的平均承受压力为5 570千克/cm2。试用 0.05的显著水平,检验这条生产线上的车轴是否符合要求? (总体标准差已知,样本容量为100根车轴,故选择正态分布) 已知: n100根 250千克/cm2 = 0.055600千克/cm2 5570千克/cm2 解:(过硬过软均会带来不利影响,故选择双侧检验)(图见下页) 建立假设: H0: H1: 构建统计量:1.2 根据 = 0.05,查Z值表得临界值:Z/21.96 计算结果:| Z | | t/2 | ,样本平均数落在拒绝区域
8、,所以拒绝原假设,说明该日生产不正常。产品显著过厚。 1.8830.0050.0092 1.833 0 1.833 2.8 或 0.1408 0.15 0.1592 2、单侧检验 例52.4 某地水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响。为此心理学家采用某种智力测验方法,对该地区随机抽取的26名儿童进行智力测验,测得平均分是94分(正常一般为100分),标准差为15分。问该地区儿童的智力水平是否明显低于一般水平?(显著水平为5)样本容量为26,属小样本,故选择 t分布) n25 Sx15分 = 0.05 100分 94分 (检验智力是否明显偏低,
9、故用左单侧检验)2 根据 = 0.05,自由度为26125,查 t 值表得临界值:t1.708 | t | ,样本平均数落在拒绝区域,所以拒绝原假设,显然,该地区儿童的智力明显低于一般水平。 1.70835.124 接受域 0.05 2 1.708 或 94.876 100 二、总体成数的检验 例52.5 某企业生产某产品的一级品率总是稳定在80左右。经选用新材料后,企业在其生产的该产品中随机抽取了 400件进行检查,有332件一级品。试用5的显著水平,检验该产品的一级品率是否发生显著的变化? (每件产品要么一级品或要么非一级品,所以是属性总体的成数问题;样本容量为200件,大样本,故选择成数的正态分布) n200件 p20.80.2 = 0.05 P80% p332/400 = 83% (采用新材料,可能使一级品增加也可能使一级品减少,所以采用双侧检验) 1.960.020.0392 P0.8 P 0.8 接受域 1.96 0 1.96 或 0.7
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1