1、新教材人教A版选择性必修第三册 83 列联表与独立性检验 学案8.3列联表与独立性检验最新课标(1)通过实例,理解22列联表的统计意义(2)通过实例,了解22列联表独立性检验及其应用教材要点要点一分类变量与列联表1.分类变量:区别不同的现象或性质的随机变量称为分类变量1.分类变量的取值一定是离散的2.分类变量是大量存在的,如是否吸烟,商品的等级等2.22列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为y1y2合计x1ababx2cdcd合计acbdabcd(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究两个
2、分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为22列联表(2)列联表有助于直观地观测数据之间的关系,如a表示既满足x1,又满足y1的样本量,表示在x1情况下,又满足y1条件的样本所占的频率要点二独立性检验1.定义:利用2的取值推断分类变量X和Y是否独立性的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验2.公式:2.3.临界值:忽略2的实际分布与该近似分布的误差后,对于任何小概率值,可以找到相应的正实数x,使得P(2x)成立,称x为的临界值这个临界值就可作为判断2大小的标准常用临界值表如下:0.10.050.010.0050.001x2.7063.8416.6357
3、.87910.828列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体,即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释,比如:210.828,就认为有99.9%以上的把握认为“两个分类变量有关系”,或者说在犯错误的概率不超过0.1%的前提下,可以认为“两个分类变量有关系”通常认为22.706时,样本数据中没有充分的证据支持结论“两个分类变量有关系”基础自测1.判断正
4、误(正确的画“”,错误的画“”)(1)列联表中的数据是两个分类变量的频数()(2)事件A与B的独立性检验无关,即两个事件互不影响()(3)2的大小是判断事件A与B是否相关的统计量()(4)独立性检验的方法和数学上的反证法是一样的()2.如表是一个22列联表:则表中a,b的值分别为()y1y2合计x1a2173x2222547合计b46120A.94,72 B52,50C52,74 D74,523.在对人们休闲方式的一次调查中,根据数据建立如下的22列联表:看书运动合计男82028女161228合计243256根据表中数据,得到24.667,所以我们至少有()的把握判定休闲方式与性别有关系(参考
5、数据:P(23.841)0.05,P(26.635)0.01)()A99% B95%C1% D5%4.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠在照射后14天内的结果如表所示:死亡存活合计第一种剂量141125第二种剂量61925合计203050进行统计分析时的统计假设是_题型一两个分类变量之间的关联关系自主完成1.某村庄对该村内50名老年人、年轻人每年是否体检的情况进行了调查,统计数据如表所示:每年体验每年未体验合计老年人a7c年轻人6bd合计ef50已知抽取的老年人、年轻人各25名,则完成上面的列联表数据错误的是()Aa18 Bb19Ccd50 De
6、f22.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到了“打鼾与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是()A100个心脏病患者中至少有99人打鼾B1个人患心脏病,那么这个人有99%的概率打鼾C在100个心脏病患者中一定有打鼾的人D在100个心脏病患者中可能一个打鼾的人都没有3.在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,请根据题目的条件列出22列联表并由列联表估计色盲与性别是否有关方法归纳利用22列联表判断两个分类变量的关系题型二独立性检验的初步应用师生共研例1下表是某地区的一种传染病与饮用水的调查表:得
7、病不得病合计干净水52466518不干净水94218312合计146684830这种传染病是否与饮用水的卫生程度有关?请说明理由方法归纳独立性检验的具体做法:(1)列出22列联表;(2)根据实际问题的需要零假设;(3)利用公式,计算2.(4)与临界值x比较作出判断跟踪训练1某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件能否在犯错误的概率不超过0.001的前提下认为质量监督员甲在不在生产现场与产品质量好坏有关系?题型三独立性检验与概率、统计的综合师生共研例2新生儿某疾病要接种三次疫苗免疫(即0、1、6月龄
8、),假设每次接种之间互不影响,每人每次接种成功的概率相等,为了解新生儿该疾病疫苗接种剂量与接种成功之间的关系,现进行了两种接种方案的临床试验:10 g/次剂量组与20 g/次剂量组,试验结果如表:接种成功接种不成功合计(人)10 g/次剂量组9001001 00020 g/次剂量组973271 000合计(人)1 8731272 000(1)根据数据说明哪种方案接种效果好?并能否判断认为该疾病疫苗接种成功与两种接种方案有关?(2)以频率代替概率,若选用接种效果好的方案,参与该试验的1 000人的成功人数比此剂量只接种一次的成功人数平均提高多少人参考公式:2,其中nabcd.参考附表:0.050
9、0.0100.001x3.8416.63510.828跟踪训练2已知甲、乙两家公司都愿意聘用某求职者,这两家公司的具体聘用信息如下:甲公司职位ABCD月薪/元6 0007 0008 0009 000获得相应职位的概率0.40.30.20.1乙公司职位ABCD月薪/元5 0007 0009 00011 000获得相应职位的概率0.40.30.20.1(1)根据以上信息,如果你是该求职者,你会选择哪一家公司?说明理由;(2)某课外实习作业小组调查了1 000名职场人士,就选择这两家公司的意愿进行了统计,得到如下数据分布:人员结构选择意愿40岁以上(含40岁)男性40岁以上(含40岁)女性40岁以下
10、男性40岁以下女性选择甲公司11012014080选择乙公司15090200110若分析选择意愿与年龄这两个分类变量,计算得到的25.551 3,则得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是多少?并用统计学知识分析, 选择意愿与年龄变量和性别变量哪一个关联性更大?附:2,0.0500.0250.0100.005x3.8415.0246.6357.879易错辨析独立性检验时武断下结论致错 例3调查者通过询问男、女大学生在购买食品时是否看生产日期和保质期得到的数据如下表所示,试分析看生产日期和保质期是否与性别有关看生产日期和保质期不看生产日期和保质期合计男大学生233255女大学生92
11、534合计325789解析:由题意,22.1493.841,所以至少有95%的把握判定休闲方式与性别有关系故选B.答案:B4解析:根据假设性检验的概念知,应假设“电离辐射的剂量与人体受损程度无关”答案:电离辐射的剂量与人体受损程度无关题型探究课堂解透题型一1解析:因为a7c25,6bd25,a6e,7bf,ef50,所以a18,b19,cd50,e24,f26,ef2,故选D.答案:D2解析:有99%的把握认为“打鼾与患心脏病有关”的结论成立,与多少个人打鼾没有关系,只有D选项正确,故选D.答案:D3解析:根据题目所给的数据列出如下列联表:色盲不色盲合计男38442480女6514520合计4
12、49561 000,显然,且两个比例的值相差较大,故可以粗略估计患不患色盲与性别有关题型二例1解析:零假设为:H0:传染病与饮用水的卫生程度无关根据列联表中的数据,经计算得到254.2110.828x0.001根据小概率值0.001的独立性检验,推断H0不成立,即认为这种传染病与饮用水的卫生程度有关跟踪训练1解析:根据题目所给数据得如下22列联表:合格品次品合计甲在生产现场9828990甲不在生产现场49317510合计1 475251 500零假设为:H0:质量监督员甲在不在生产现场与产品质量好坏无关根据列联表中的数据,经计算得到213.09710.828x0.001根据小概率值0.001的
13、独立性检验,推断H0不成立,即认为质量监督员甲在不在生产现场与产品质量好坏有关题型三例2解析:(1)由于两种接种方案都是1 000人接受临床试验,接种成功人数10 g/次剂量组900人,20 g/次剂量组973人,且973900,所以方案20 g/次剂量组接种效果好;计算244.80610.828x0.001所以能判断认为该疾病疫苗接种成功与两种接种方案有关(2)假设20 g/次剂量组临床试验接种一次成功的概率为p,由数据知,三次接种成功的概率为0.973,不成功的概率为0.027,由于三次接种之间互不影响,每人每次接种成功的概率相等,所以(1p)30.027,解得p0.7;设参与试验的1 0
14、00人此剂量只接种一次成功的人数为X,显然XB(1 000,0.7),E(X)1 0000.7700,参与试验的1 000人此剂量只接种一次成功的人数平均为700人,且973700273.试验选用20 g/次剂量组方案,参与该试验的1 000人比此剂量只接种一次的成功人数平均提高273人跟踪训练2解析:(1)设甲公司与乙公司的月薪分别为随机变量X,Y,则E(X)6 0000.47 0000.38 0000.29 0000.17 000,E(Y)5 0000.47 0000.39 0000.211 0000.17 000,D(X)(6 0007 000)20.4(7 0007 000)20.3(
15、8 0007 000)20.2(9 0007 000)20.11 0002,D(Y)(5 0007 000)20.4(7 0007 000)20.3(9 0007 000)20.2(11 0007 000)20.12 0002,则E(X)E(Y),D(X)5.024,根据表中对应值,得出“选择意愿与年龄有关系”的结论犯错误的概率的上限是0.025.由数据分布可得选择意愿与性别这两个分类变量的22列联表如下:选择甲公司选择乙公司合计男250350600女200200400合计4505501 000则26.734,且6.7346.635,对照临界值表可得“选择意愿与性别有关”的结论犯错误的概率的上限为0.01,由于0.010.025,所以与年龄相比,选择意愿与性别关联性更大
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1