1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx

上传人:b****5 文档编号:5608584 上传时间:2022-12-29 格式:DOCX 页数:11 大小:90.67KB
下载 相关 举报
1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx_第1页
第1页 / 共11页
1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx_第2页
第2页 / 共11页
1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx_第3页
第3页 / 共11页
1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx_第4页
第4页 / 共11页
1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx

《1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx》由会员分享,可在线阅读,更多相关《1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx(11页珍藏版)》请在冰豆网上搜索。

1920 第1章 2 22 独立性检验 23 独立性检验的基本思想 24 独立性检验的应用.docx

1920第1章222独立性检验23独立性检验的基本思想24独立性检验的应用

2.2 独立性检验

2.3 独立性检验的基本思想

2.4 独立性检验的应用

学习目标

核心素养

1.了解独立性检验的基本思想方法.(重点)

2.了解独立性检验的初步应用.(难点)

1.借助了解独立性检验的思想,提升学生数学抽象的核心素养.

2.通过独立性检验的分析应用,培养学生数据分析的核心素养.

1.独立性检验

设A,B为两个变量,每一个变量都可以取两个值,变量A:

A1,A2=

1;变量B:

B1,B2=

1,有下面2×2列联表:

A

B

B1

B2

总计

A1

a

b

a+b

A2

c

d

c+d

总计

a+c

b+d

n=a+b+c+d

其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.

2.独立性检验的基本思想

在2×2列联表中,令χ2=

,当数据量较大时,在统计中,用以下结果对变量的独立性进行判断:

(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;

(2)当χ2>2.706时,有90%的把握判定变量A,B有关联;

(3)当χ2>3.841时,有95%的把握判定变量A,B有关联;

(4)当χ2>6.635时,有99%的把握判定变量A,B有关联.

1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力(  )

A.平均数与方差 B.回归分析

C.独立性检验D.概率

C [判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C.]

2.在2×2列联表中,两个比值

与________相差越大,两个分类变量有关系的可能性越大.

 [根据2×2列联表可知,比值

相差越大,则|ad-bc|就越大,那么两个分类变量有关系的可能性就越大.]

3.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:

文艺节目

新闻节目

总计

20至40岁

40

18

58

大于40岁

15

27

42

总计

55

45

100

由表中数据直观分析,收看新闻节目的观众是否与年龄有关:

________(填“是”或“否”).

是 [因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即

,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.]

2×2列联表

【例1】 在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用

判断二者是否有关系.

思路点拨:

[解] 2×2列联表如下:

年龄在六十岁以上

年龄在六十岁以下

总计

饮食以蔬菜为主

43

21

64

饮食以肉类为主

27

33

60

总计

70

54

124

将表中数据代入公式得

=0.671875.

=0.45.

显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.

利用2×2列联表的关键及注意事项

1.作2×2列联表时,关键是对涉及的变量分清类别.注意应该是4行4列,计算时要准确无误.

2.利用2×2列联表分析两变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将

的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.

1.在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.

[解] 作列联表如下:

喜欢甜食情况

性别

喜欢甜食

不喜欢甜食

总计

117

413

530

492

178

670

总计

609

591

1200

独立性检验

【例2】 在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:

能否在犯错误的概率不超过1%的前提下认为该种血清能起到预防感冒的作用.

未感冒

感冒

总计

使用血清

258

242

500

未使用血清

216

284

500

总计

474

526

1000

思路点拨:

独立性检验可以通过2×2列联表计算χ2的值,然后和临界值对照作出判断.

[解] 假设感冒与是否使用该种血清没有关系.

由列联表中的数据,求得χ2的值为

χ2=

≈7.075.

χ2≈7.075>6.635,

查表得P(χ2>6.635)=0.01,

故我们在犯错误的概率不超过1%的前提下,即有99%的把握认为该种血清能起到预防感冒的作用.

独立性检验的一般步骤

1.根据样本数据列2×2列联表.

2.计算χ2=

的值.

3.将χ2的值与临界值进行比较,若χ2大于临界值,则认为X与Y有关,否则没有充分的理由说明这个假设不成立.

2.“十一”黄金周前某地的一旅游景点票价上浮,黄金周过后,统计本地与外地来的游客人数,与去年同期相比,结果如下:

本地

外地

总计

去年

1407

2842

4249

今年

1331

2065

3396

总计

2738

4907

7645

能否在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系?

[解] 按照独立性检验的基本步骤,假设票价上浮后游客人数与所处地区没有关系.

因为χ2=

≈30.35>6.635.

所以在犯错误的概率不超过0.01的前提下认为票价上浮后游客人数与所处地区有关系.

独立性检验的综合应用

[探究问题]

1.当χ2>3.841时,我们有多大的把握认为事件A与B有关?

[提示] 由临界值表可知当χ2>3.841时,我们有95%的把握认为事件A与B有关.

2.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.我们是否可以判定100个心脏病患者中一定有打鼾的人?

[提示] 这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知100个心脏病患者中可能一个打鼾的人都没有.

【例3】 为了解某市创建文明城市过程中,学生对创建工作的满意情况,相关部门对某中学的100名学生进行调查,其中有50名男生对创建工作表示满意,有15名女生对创建工作表示不满意.已知在全部100名学生中随机抽取1人,其对创建工作表示满意的概率为

.是否有充足的证据说明,学生对创建工作的满意情况与性别有关?

思路点拨:

解决本题首先根据对工作满意的概率,确定对工作满意的男女生人数,再画出2×2列联表,最后根据2×2列联表计算χ2,并进行判断.

[解] 由题意得2×2列联表如下:

满意

不满意

总计

男生

50

5

55

女生

30

15

45

总计

80

20

100

χ2=

≈9.091>6.635,

所以我们有99%的把握认为学生对创建工作的满意情况与性别有关.

独立性检验应用时的关键要点

1.解决此类问题的关键是正确列出2×2列联表,并代入公式求出χ2的值,然后判断得出结论,由于数据较多,在计算上容易出错应引起注意.

2.独立性检验仍然属于用样本估计总体,由于样本抽取具有随机性,因而作出的推断可能正确,也可能错误,有95%(或99%)的把握说事件A与B有关,则推断结论为错误的可能性仅为5%(或1%).

3.有两个变量x与y,其一组观测值如下2×2列联表所示:

y

x

y1

y2

x1

a

20-a

x2

15-a

30+a

其中a,15-a均为大于5的整数,则a取何值时,有95%的把握认为x与y之间有关系?

[解] 由题意χ2=

.

∵有95%的把握认为x与y之间有关系,

∴χ2>3.841,

>3.841,a>7.7或a<1.5.

又a>5,15-a>5,∴7.7

又a∈N,

∴a=8或a=9.

1.利用2×2列联表判断两变量之间是否独立的步骤

第一步:

根据调查结果和数据,列出所要研究的两个变量之间的2×2列联表.

第二步:

计算总和,即变量A、B的总数.

第三步:

求频率.

第四步:

判断.

2.独立性检验的基本思想是:

要确认两个变量有关系这一结论成立的可信程度,首先假设结论“两个变量没有关系”成立,在该假设下我们构造的统计量χ2应该很小,如果用观测数据计算的统计量χ2很大,则在一定程度上说明假设不合理.由χ2与临界值的大小关系,作出判断.

1.对分类变量X与Y的统计量χ2的值说法正确的是(  )

A.χ2越大,“X与Y有关系”的把握性越小

B.χ2越小,“X与Y有关系”的把握性越小

C.χ2越接近于0,“X与Y无关系”的把握性越小

D.χ2越大,“X与Y无关系”程度越大

B [χ2越大,X与Y越不独立,所以关联越大;相反,χ2越小,关联越小.]

2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算χ2≈8.01,则认为“喜欢乡村音乐与性别有关系”的把握性约为(  )

χ2≥k

0.100

0.050

0.025

0.010

0.001

k

2.706

3.841

5.024

6.635

10.828

A.0.1%   B.1%

C.99%D.99.9%

C [因为χ2>6.635,所以有99%以上的把握认为“喜欢乡村音乐与性别有关系”.]

3.以下关于独立性检验的说法中,正确的是________.

①独立性检验依据小概率原理;

②独立性检验得到的结论一定正确;

③样本不同,独立性检验的结论可能有差异;

④独立性检验不是判断两分类变量是否相关的唯一方法.

①③④ [独立性检验得到的结论不一定正确,故②错,①③④正确.]

4.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:

满意

不满意

男顾客

40

10

女顾客

30

20

(1)分别估计男、女顾客对该商场服务满意的概率;

(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?

附:

χ2=

P(χ2≥k)

0.050

0.010

0.001

k

3.841

6.635

10.828

[解] 

(1)由调查数据,男顾客中对该商场服务满意的比率为

=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为

=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.

(2)χ2=

≈4.762.

由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1