假设检验(2013)1.ppt
《假设检验(2013)1.ppt》由会员分享,可在线阅读,更多相关《假设检验(2013)1.ppt(45页珍藏版)》请在冰豆网上搜索。
第3章假设检验
(1)参数假设检验1.今年的居民消费水平比去年是否有明显的提今年的居民消费水平比去年是否有明显的提高?
高?
2.重庆的交通堵塞状况比过去重庆的交通堵塞状况比过去5年是否有所改善年是否有所改善?
3.经过三年的河水污染治理,污染情况是否有经过三年的河水污染治理,污染情况是否有较大的改善?
较大的改善?
一些实际问题:
例例3.1.13.1.1某咨询公司根据过去资料与现状想了解国内旅游消费情某咨询公司根据过去资料与现状想了解国内旅游消费情况。
譬如,某条旅游线路的旅费况。
譬如,某条旅游线路的旅费XX(元(元/人)人)XXNN(1010,2051010,205)(过去),现抽查了(过去),现抽查了400400名游客,测得名游客,测得,问现在的旅,问现在的旅费与过去比较是否有显著的变化?
费与过去比较是否有显著的变化?
一、假设检验的问题增加?
增加?
提出假设:
提出假设:
“旅费旅费无无显著变化显著变化”等价于等价于“”,称为,称为原假设,记为原假设,记为HH00:
另一个假设:
另一个假设:
“旅费旅费有有显著变化显著变化”等价于等价于“”,称,称为备选假设,记为为备选假设,记为HH11:
问这批产品是否合格?
251,249,248,250,252,250,251,250,252,249,251,250,251,248,251250问题2某生产流水线生产草莓罐头,规定每只罐头标重是250克,现得到流水线上一组连续的15个数据如下问成绩分布如何?
问题3某次数学课程考试成绩的分布如下直方图分数分数0303150515960697079808990100其他其他学生人数学生人数最高分最高分最低分最低分全距全距平均成绩平均成绩人数人数4420202727262635352323662214314398982323757565.5744765.57447百分比百分比2.84%2.84%14.18%14.18%19.15%19.15%18.44%18.44%24.82%24.82%16.31%16.31%4.26%4.26%问各地的居民喜好如何?
问题4某建筑装修公司想了解某城市的三个地区的乔迁居民喜好木质地板的情况,目的是决定对这些地区应采取何种营销策略.该公司的调研部进行了一项调查,统计数据如下表.地板地板材料材料地地区区合计合计123木质木质地板地板其他其他6978126991627211204合计合计14722543415或者说各地的居民喜好木质地板是否一致?
以例以例3.1.13.1.1为例为例二、检验的基本思想所以所以HH00的拒绝域为:
的拒绝域为:
由于由于如何检验?
假设假设HH00成立,则成立,则由由1-1-=0.95=0.95,结论:
拒绝结论:
拒绝HH00.二、检验的基本思想HH00的拒绝域的形式不唯一。
的拒绝域的形式不唯一。
三、检验步骤1.1.由实际问题提出由实际问题提出HH00和和HH11;“显著差异显著差异”以正态分布的以正态分布的为例为例“显著增大显著增大”“显著减少显著减少”注意:
要被证明的命题确定为备择假设(H1)。
逆命题称为原假设(H0)首先假设H0是正确的。
如果数据不能够合理排除H0,那么,H0不能被拒绝。
但是,不拒绝H0并不意味着我们承认它是正确的。
这只代表H0作为观察数据的可能解释不能被拒绝。
三、检验步骤2.2.由由HH11选择拒绝域的形式;选择拒绝域的形式;三、检验步骤3.3.确定检验统计量及分布;确定检验统计量及分布;4.4.计算和判断。
计算和判断。
四、关于显著水平的解释当一个假设检验被看成是一个决策过程时,会出现两当一个假设检验被看成是一个决策过程时,会出现两类错误。
类错误。
决定事实不拒绝不拒绝H0拒绝拒绝H0H0为真正确决定正确决定置信度置信度1-第一类错误第一类错误显著水平显著水平H0为假第二类错误第二类错误检测失败检测失败正确决定正确决定检测的概率检测的概率1-=1=1两类错判概率与之间的关系与1-是直接相关的,与1-同时增大或减小。
假设例1设设有三个拒绝域:
试分析它们的两类错误的概率。
哪一个最佳?
五、参数假设检验1.1.单正态总体单正态总体五、参数假设检验UU检验法检验法tt检验法检验法五、参数假设检验卡方检验法卡方检验法例2一汽车轮胎制造商声称,他们生产的某一等级的轮胎平均寿命在一定的汽车重量和正常行驶条件下大于50000公里。
现对这一等级的120个轮胎组成的随机样本进行了测试,测得平均每一个轮胎的寿命为51000公里,样本标准差是5000公里。
已知这种轮胎寿命服从正态分布。
试根据抽样数据在显著性水平下判断该制造商的产品是否与他所说的标准相符合。
提出问题:
相符不相符因为样本观测值落在H0的拒绝域内,得出结论:
该制造商的声称可信,其生产的轮胎平均寿命显著地大于50000公里。
(2)选择检验统计量(3)确定拒绝域例3某机器加工的B型钢管的长度服从标准差为2.4公分的正态分布。
现从一批新生产的B型钢管中随机选取25根,测得样本标准差为2.7公分。
试以显著水平1%判断该批钢管长度的变异性与标准差2.4比较是否有明显变化?
提出问题:
针对参数选择估计量S2由此判断:
不拒绝H0,说明该批钢管长度的变异性与标准差2.4比较没有明显变化。
(4)计算五、参数假设检验在大样本情况下,使用中心极限定理,正态总体的均在大样本情况下,使用中心极限定理,正态总体的均值的推断过程可以扩展到非正态总体的均值推断上。
值的推断过程可以扩展到非正态总体的均值推断上。
例4一项调查结果显示某市老年人口比重为14.7%。
该市老年人口研究协会为了检验该项调查是否可靠,随机抽选了400名居民,发现其中有57人是老年人。
问调查结果是否支持该市老年人口比重为14.7%的看法?
提出问题:
因为样本观测值落在H0的拒绝域以外,得出结论:
接受H0,调查结果显示支持该市老年人口比重为14.7%的看法。
(2)选择检验统计量(3)确定拒绝域例5某十字路口早上8点钟左右是交通高峰期。
根据以往的统计知,该路口每天单位时间内通过的车辆数服从泊松分布,且车流量是0.5辆/秒。
下列数据是某天该路口8点后1分钟内车辆到达的时刻.2.75.5”7.5”11.4”14.1”14.4”14.8”15.6”16.7”19.6”20.7”23.3”24.5”24.7”27.6”29.9”31.1”31.8”33.7”36.5”37.4”42.2”44.1”44.3”46.6”46.9”47.7”50.2”50.3”50.6”50.9”52.5”55.4”58.4”58.6”试以这些数据检验该路口的车流量与过去相比是否有明显改变?
(=0.05)提出问题:
解一每个区间到达车辆数每个区间到达车辆数01234小区间个数小区间个数3518511将1分钟分为60个小区间,1秒钟为一个区间。
结论:
接受H0,认为该路口的车流量平均为0.5辆/秒。
解二提出问题:
相邻两辆车的时间间隔设为X,则它服从参数的指数分布。
数据转换为2.82.03.92.70.30.40.81.42.91.12.61.20.22.92.31.20.71.92.80.94.81.90.22.30.30.82.50.10.30.31.62.93.00.2n=34解二结论:
接受H0,认为该路口的车流量平均为0.5辆/秒。
五、参数假设检验2.2.双正态总体双正态总体五、参数假设检验五、参数假设检验五、参数假设检验在选择一个新建超市的位置时需要考虑很多因素,其中超市所处的地理位置附近居民的收入水平是重要的因素之一。
现有A、B两地可供选择,A地的建筑费用比B地低,如果两地居民的年均收入相同,就选择A地建超市。
但若B地居民的年均收入明显高于A地,则超市选在B地。
从有关方面获知,A地居民年收入标准差是4746元,B地居民年收入标准差5365元。
现从两地的居民户中各抽取了100户居民,经调查分析知:
A地年均收入28650元,B地年均收入29980元。
问超市在何地建?
超市的选址问题AB信息:
建筑费用A低于B如果1=2(年均收入),则选A;如果12,则选B。
超市的选址问题假设:
A地B地超市的选址问题假设:
A地B地超市的选址问题结论:
拒绝H0,A地平均收入明显低于B地,所以,应该在B地建超市。
为了比较制作鞋子后跟材料的质量,选取了15个男子(他们的生活条件各不相同)。
每双新鞋,左只使用材料A,右只使用材料B,厚度均为10mm。
一月后测试厚度获得如下数据:
两种材料的质量比较材料材料AA6.66.6778.38.38.28.25.25.29.39.37.97.98.58.57.87.87.57.56.16.18.98.96.16.19.49.49.19.1材料材料BB7.47.45.45.48.88.8886.86.89.19.16.36.37.57.5776.56.54.44.47.77.74.24.29.49.49.19.1问材料A是否比材料B耐穿?
(=0.05)配对检验法材料材料AA6.66.6778.38.38.28.25.25.29.39.37.97.98.58.57.87.87.57.56.16.18.98.96.16.19.49.49.19.1材料材料BB7.47.45.45.48.88.8886.86.89.19.16.36.37.57.5776.56.54.44.47.77.74.24.29.49.49.19.1A-BA-B:
-0.8-0.81.61.6-0.5-0.50.20.2-1.6-1.60.20.21.61.6110.80.8111.71.71.21.21.91.90000配对配对tt2.0958762.095876tt0.950.95(14)(14)1.761311.76131结论:
拒绝H0,认为材料A比材料B耐穿。
非配对检验法材料材料AA6.66.6778.38.38.28.25.25.29.39.37.97.98.58.57.87.87.57.56.16.18.98.96.16.19.49.49.19.1材料材料BB7.47.45.45.48.88.8886.86.89.19.16.36.37.57.5776.56.54.44.47.77.74.24.29.49.49.19.1结论:
不拒绝H0,认为材料A不比材料B耐穿。
xbar=xbar=7.72677.7267ssx=ssx=1.66071.6607n=n=1515ybar=ybar=7.17337.1733ssy=ssy=2.65782.6578m=m=1515非配对非配对tt1.03131.0313tt0.950.95(28)(28)2.04842.0484为什么?
P值检验法材料材料AA6.66.6778.38.38.28.25.25.29.39.37.97.98.58.57.87.87.57.56.16.18.98.96.16.19.49.49.19.1材料材料BB7.47.45.45.48.88.8886.86.89.19.16.36.37.57.5776.56.54.44.47.77.74.24.29.49.49.19.1配对P值0.0274非配对P值0.1556=ttest(数组1,数组2,1,2)1单尾,2双尾结论:
配对拒绝H0非配对不拒绝H0,五、参数假设检验2.2.双正态总体双正态总体测得两批电子元件的样品的电阻(欧)为:
例第一批第一批XX0.140.140.1380.1380.1430.1430.1420.1420.1440.1440.1370.137第二批第二批YY0.1350.1350.140.140.1420.1420.1360.1360.1380.1380.140.14假设电阻服从正态分布。
试问这两批电子元件的电阻有无显著差异?
(=0.05)例结论:
接受H0,这两批电子元件的电阻方差无显著差异。
n=n=66xbar=xbar=0.14070.1