1、答案可通过表格与图形进行直观分析,也可通过统计分析定量判断.梳理(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表定义:列出的两个分类变量的频数表,称为列联表.2一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(也称为22列联表)为下表.y1y2总计x1ababx2cdcdacbdabcd知识点二等高条形图1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.2.如果通过直接计算或等高条形图发现和相差很大,就判断两个分类变量之间有关系.知识点三独立性检验1.定义
2、:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2,其中nabcd为样本容量.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.列联表中的数据是两个分类变量的频数.()2.事件A与B的独立性检验无关,即两个事件互不影响.()3.K2的大小是判断事件A与B是否相
3、关的统计量.()类型一等高条形图的应用例1为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数铅中毒病人29736对照组92837383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点定性分析的两类方法题点利用图形定性分析解等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.反思与感悟在等高条形图中,可以估计满
4、足条件Xx1的个体中具有Yy1的个体所占的比例,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例.两个比例的值相差越大,X与Y有关系成立的可能性就越大.跟踪训练1网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?解根据题目所给的数据得到如下22列联表:经常上网不经常上网不及格80120200及格6808001 000得出等高条形图如图所示:比较图中阴影部分的
5、高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.类型二独立性检验例2某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品南方学生20北方学生107030100根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.考点独立性检验及其基本思想题点独立性检验的方法解将22列联表中的数据代入公式计算,得K2的观测值k4.762.因为4.7623.841,所以在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有
6、差异”.反思与感悟(1)独立性检验的关注点在22列联表中,如果两个分类变量没有关系,则应满足adbc0,因此|adbc|越小,关系越弱;|adbc|越大,关系越强.(2)独立性检验的具体做法根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界,然后查表确定临界值k0.利用公式K2计算随机变量K2的观测值k.如果kk0,推断“X与Y有关系”这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够的证据支持结论“X与Y有关系”.跟踪训练2某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教
7、育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个22列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.解(1)22列联表如下所示:赞同不赞同老教师青年教师246341650(2)假设“对新课程教学模式的赞同情况与教师年龄无关”.由公式得K24.9636.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.类型三独立性检验的综合应用例3(
8、2017全国改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量50 kg箱产量50 kg旧养殖法新养殖法附:P(K2k0)0.0500.0100.001k03.8416.63510.828K2.考点独立性检验思想的应用题点分类变量与统计、概率的综合性问题解(1)记B表示事件“旧
9、养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,由P(A)P(BC)P(B)P(C),则旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62,新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66,则事件A的概率估计值为P(A)P(B)P(C)0.620.660.409 2,A发生的概率为0.409 2.(2)根据箱产量的频率分布直方图得到列联表:626696104则K215.705,由15.7056.635,故有
10、99%的把握认为箱产量与养殖方法有关.反思与感悟两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例.两个比例的值相差越大,X与Y有关系成立的可能性就越大.(2)观测值法:通过22列联表,先计算K2的观测值k,然后借助k的含义判断“两个分类变量有关系”这一结论成立的可信程度.跟踪训练3为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2喜爱打篮球不喜爱打篮球48已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为.(1)请将上面的22
11、列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X,求X的分布列与均值.解(1)列联表补充如下:2232(2)由K24.286.因为4.2863.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关.(3)喜爱打篮球的女生人数X的可能取值为0,1,2.其概率分别为P(X0),P(X1),P(X2),故X的分布列为X12PX的均值为E(X)01.1.某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近
12、视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数 B.方差 C.回归分析 D.独立性检验题点独立性检验的思想答案D2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大答案B解析k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.3.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是()解析由等高条形图易知,D选项两
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1