《独立性检验的基本思想及其初步应用》Word文件下载.doc

上传人:b****3 文档编号:15023964 上传时间:2022-10-26 格式:DOC 页数:21 大小:423.50KB
下载 相关 举报
《独立性检验的基本思想及其初步应用》Word文件下载.doc_第1页
第1页 / 共21页
《独立性检验的基本思想及其初步应用》Word文件下载.doc_第2页
第2页 / 共21页
《独立性检验的基本思想及其初步应用》Word文件下载.doc_第3页
第3页 / 共21页
《独立性检验的基本思想及其初步应用》Word文件下载.doc_第4页
第4页 / 共21页
《独立性检验的基本思想及其初步应用》Word文件下载.doc_第5页
第5页 / 共21页
点击查看更多>>
下载资源
资源描述

《独立性检验的基本思想及其初步应用》Word文件下载.doc

《《独立性检验的基本思想及其初步应用》Word文件下载.doc》由会员分享,可在线阅读,更多相关《《独立性检验的基本思想及其初步应用》Word文件下载.doc(21页珍藏版)》请在冰豆网上搜索。

《独立性检验的基本思想及其初步应用》Word文件下载.doc

1.下列变量中不属于分类变量的是(B)

A.性别     B.吸烟

C.宗教信仰D.国籍

解析:

“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选B.

2.下面是一个2×

2列联表

合计

21

73

2

25

27

46

100

则表中a、b的值分别为(C)

A.94、96B.52、50

C.52、54D.54、52

由a+21=73,得a=52,由b+46=100,得b=54.

3.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:

为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=≈4.844>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为____________.

P(K2>3.841)=0.05,判断出错的可能性为5%.

答案:

5%

通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计.

独立性检验的基本思想,随机变量K2的含义.

(1)直观分析的两种方法.

①频率分析.

通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常通过列联表列出两个分类变量进行分析.

  y

x  

在列联表中,如果两个分类变量没有关系,则应该满足ad-bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越弱;

|ad-bc|越大,说明两个分类变量之间的关系越强.

②图形分析.

利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系.

a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形图中有两个高度相同的矩形,每一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系.

(2)独立性检验及其基本思想.

①独立性检验.

利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.

利用上诉公式求出K2的观测值为

k=.

再得出X与Y有关系的程度,通常用到以下数据:

(i)如果k>6.635,在犯错误的概率不超过0.01的前提下认为X与Y有关系;

(ii)如果k>2.706,在犯错误的概率不超过0.1的前提下认为X与Y有关系;

值得注意的是:

观察值k越大,越有利于结论“X和Y有关系”,越小越有利于结论“X和Y没有关系”.因此,可以建立一定的规则:

当k≥k0时就说X与Y有关系,k<k0时就说X和Y没有关系,故求得观测值后只要与建立的规则进行比较即可得出结论.

②独立性检验的基本思想.

独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观察数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%,不合理的程度可查下表得出:

1.独立性检验是对两个分类变量间是否有关系的一种案例分析方法,其分析方法有:

等高条形图法和利用假设的思想方法,计算出某一个随机变量K2的观测值来进行判断.

2.在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例为,也可以估计满足条件X=x2的个体中具有Y=y2的个体

所占的比例为,两个比例的值相差越大,两个分类变量相关的可能性就越大.

3.独立性检验的一般步骤:

(1)根据样本数据制成2×

2列联表;

(2)根据公式K2=计算K2的观测值;

(3)比较K2与临界值的大小关系作统计推断.

                  

1.在等高条形图形中,下列哪两个比值相差越大,“两个分类变量有关系”成立的可能性越大(C)

A.与B.与

C.与D.与

2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表;

爱好

40

20

60

不爱好

30

50

110

由K2=算得,

K2=≈7.8.

附表:

P(F2≥k0)

0.050

0.010

0.001

k0

3.841

6.635

10.828

参照附表,得到的正确结论是(A)

A.有99%以上的把握认为“爱好该项运动与性别有关”

B.有99%以上的把握认为“爱好该项运动与性别无关”

C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”

D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”

3.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:

  专业

性别  

非统计专业

统计专业

13

10

7

为了判断主修统计专业是否与性别有关系,根据表中数据得到,

k=≈4.844,因为k>3.841,所以确定主修统计专业与性别有关系,那么这种判断出错的可能性为________.

∵k=4.844>3.841,∴有95%的把握可以确定主修统计专业与性别有关,那么这种判断出错的可能性为5%.

1.在研究两个分类变量之间是否有关系时,可以粗略地判断两个分类变量是否有关的是(B)

A.散点图B.等高条形图

C.2×

2列联表D.以上均不对

2.对分类变量X与Y的随机变量K2的观测值k,说法正确的是(B)

A.k越大,“X与Y有关系”可信程度越小

B.k越小,“X与Y有关系”可信程度越小

C.k越接近0,“X与Y无关”程度越小

D.k越大,“X与Y无关”程度越大

3.下面是一个2×

2列联表:

52

54

则表中a、b的值分别是(C)

A.94、96B.25、21

C.25、27D.27、25

4.分类变量x和y的列联表如下,则(C)

A.ad-bc越小,说明x与y的关系越弱

B.ad-bc越大,说明x与y的关系越弱

C.(ad-bc)2越大,说明x与y的关系越强

D.(ad-bc)2越小,说明x与y的关系越强

由K2=知,(ad-bc)2越大,K2值越大,说明x与y的关系越强.

5.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:

认为作业多

认为作业不多

总数

喜欢玩电

脑游戏

18

9

不喜欢玩

电脑游戏

8

15

23

26

24

则认为喜欢玩电脑游戏与认为作业多少有关系的把握大约为(B)

A.99%B.95%

C.90%D.无充分依据

由表中数据计算

K2=≈5.059,

而K2=5.059>3.841,所以约有95%的把握认为两变量之间有关.

6.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14天内的结果如下表所示:

死亡

存活

第一种剂量

14

11

第二种剂量

6

19

进行统计分析时的统计假设是________.

根据独立性检验的基本思想,可知其类似反证法,即要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,对本题,进行统计分析时的统计假设应是“小白鼠的死亡与剂量无关”.

小白鼠的死亡与剂量无关

7.(2013·

韶关二模)以下四个命题中:

①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;

②样本数据3,4,5,6,7的方差为2;

③对于相关系数r。

|r|越接近1,则线性相关程度越强;

④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:

走天桥

走斑马线

由K2=可得,

K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”.

P(K2≥k0)

0.05

其中正确命题的序号是________.

②③④

8.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:

  类别

不喜欢语文

喜欢语文

为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:

0.50

0.40

0.25

0.15

0.10

0.455

0.708

1.323

2.072

2.706

0.025

0.005

5.024

7.879

判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.

9.调查某班学生,按性别和籍贯分类得调查表如下:

天津

非天津

12

28

47

65

性别对籍贯的影响中,可信度小于________.

k=≈0.277

∵0.277<0.455,∴查表可知小于0.50.

50%

10.在对人们休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;

男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,你能否判断性别与休闲方式是否有关系?

首先建立列联表如下

休闲方式为看电视

休闲方式为运动

女性

43

70

男性

33

64

124

∵a=43,b=27,a+b=70,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 考试认证 > IT认证

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1