第三章均数的抽样误差与总体均数估计.docx

上传人:b****7 文档编号:8596952 上传时间:2023-02-01 格式:DOCX 页数:10 大小:105.82KB
下载 相关 举报
第三章均数的抽样误差与总体均数估计.docx_第1页
第1页 / 共10页
第三章均数的抽样误差与总体均数估计.docx_第2页
第2页 / 共10页
第三章均数的抽样误差与总体均数估计.docx_第3页
第3页 / 共10页
第三章均数的抽样误差与总体均数估计.docx_第4页
第4页 / 共10页
第三章均数的抽样误差与总体均数估计.docx_第5页
第5页 / 共10页
点击查看更多>>
下载资源
资源描述

第三章均数的抽样误差与总体均数估计.docx

《第三章均数的抽样误差与总体均数估计.docx》由会员分享,可在线阅读,更多相关《第三章均数的抽样误差与总体均数估计.docx(10页珍藏版)》请在冰豆网上搜索。

第三章均数的抽样误差与总体均数估计.docx

第三章均数的抽样误差与总体均数估计

抽样分布与参数估计

亠久乂存么瘁2弹歹陵

抽样实验

■假设某市16岁女中学生的身高值分布服从均数p.=l55.4cm,标准差<7=5.3cm的正态分布,即兀〜"(155.4,5・32)。

■从该总体中以固定的样本含量《役复多次扌由样,如抽10000次。

抽样

X,

S,

S?

Sj

从同一总体中反复抽取若干个样本,每个样本的含量均相等,这些样本均数呈正态分布。

S'

总体中观察单位个数为N

每个样本中观察单位个数为n

正态总体N(155・4,5・32),固定样本量«=1(),抽样10000次

样本个数

2500r

1OOOO个F的分布<«=!

<)>

样本均數・X

穎数

14M-

7

150-

25

151^

1VK

152-

943

153-

126)

1S4

2029

155-

2372

156-

1KW

IOV2

15H-

424

159-

1IM

16O・

26

161-162

6

&计

KMHHI

2000

1500

IQOO

500

0

jIL

10000个样本均数X(/1=10)

样本牛数

最小值最大值

10000

1553891.673

149.554161.494

1191501511S215315(15SiSeIS7tSttSe160Hl

样木均数2.)lOOOO个样本均数的分布(210)

 

样本均数的分布规律:

(1)以固定的样本从正态总体N(“j)中反复抽样,所得样本均服从正态分布。

X的均数期望值为原正态分布的总体均数,即XT

X的标准差为25-=&:

(£-Xr/(&-1)

Sifb.,

为避免与个体变■的标准差混淆,称之为样本均》的标

准误

(样本均数标准误的估计值)

■抽样误差(samplingerror):

由于存在个体变异,抽样研究

时样本统计量不恰好等丁-总体参数,这种误差是因抽样所致,称为抽样谋差。

■抽样误差的大小与两个因素有关:

①总体中个体变异的程度;②推样时的样本含11大小

样本均数的标准误

■样本均数的标准差(记为b_),反映的是样本均数与其总

A

体均数之间的离散程度,即X-“的大小,所以可将其作为描述样本均数抽样误差大小的指标,称为样本均数的标准误。

计算如下:

(理论值)

S-

(估计值)

?

=(X-“)/s-

对样本均数的变量变换

任何止态分布都对转换为标

准正态分布M=(X-“)/b

服从」F态分布的样本均数也可转换为标准正态分布

=-

b丘未知时,以其估计值估计,W.S.Gosset

standardnormaldistribution

1908年发表J-Biometricka

 

t

cc

p(—乞『兰

f分布的分位数(单侧f界值)

 

附农2t界值表

 

率,P

mil

丿住的侧0,250.200J00.050.0250.010.0050.00250.0010,0005

"Xi(侧0,500.400.200・100.050.020.010.0050.0020.001

1.000

1.376

3.078

6.314

12.706

31,821

63.657

127321

318,309

636.619

0.816

1.06]

I.S86

2.920

4.303

6.965

9-925

14.089

22.327

31.399

0.765

0.978

1.638

2353

3JX2

4.541

5.841

7453

10.215

12.924

0.741

0,941

1.533

2.132

2.776

3.747

4,604

5.598

7.173

&610

0.727

0.920

1.476

2.01S

2.371

3.365

4.032

4.775

3・《93

6.N69

0.718

0.906

1.440

1.943

2.447

3.143

3.707

4317

5.208

5.959

0.711

0,896

1.415

1.895

2365

2,998

3,499

4.029

4.785

5.40S

0.706

0.889

1.397

1.R60

2.306

2.896

3355

3.833

4.501

5.041

0.703

0.883

1383

1.833

2.262

2.821

3.250

3.690

4.297

4.781

0.700

0.879

1372

1・812

2.228

2.764

3.169

3.581

4J44

4.587

0.686

0.859

1.323

1.721

2.080

2.518

2.831

3」35

3-527

3.819

0.686

0.858

1321

L717

2.074

2.508

2.819

3.119

3.505

3J92

0.685

0.858

1319

1.714

2,069

2.500

2-807

3.104

3.485

3.768

0,685

0,857

L3I8

L711

2.064

2.492

2.797

3.091

3.467

3・745

@684

0.856

1316

1.708

2,060

2.485

2-787

3.078

3.450

3.725

0.683

0.854

1.130

1.697

2,042

2.457

2-730

3.030

3.385

3.646

0.679

0.849

1.299

1.676

2,009

2.403

2.678

2.937

3.261

3.496

0.677

0.845

1.290

1.660

L984

2.364

2-626

2.871

3.174

3.390

0.6745

0.8416

1.2816

1.6449

L9600

23263

2.5758

2.8070

3.0902

3.2905

屮皿嘲I限足理和正态今怖推建

 

当样本含童W足够大时,即使从偏态分

正态分布推理:

布总体中以固定《抽样,其样本均数的分布也近似服从正态分布.

—'o・O5/2山VtV^0.05/2.v

 

 

—'o・O5/2山VtV^0.05/2.v

X-“

O.O5/2.VV~-V,0・05/2亡

、2

—'o・O5/2山VtV^0.05/2.v

0・05/2上

V'o.OS/2七

 

0.05/2七

 

-X

~^O.O5/2,p'^X

0.05/2,vXVV~X+^0.05/2,v*^X

0.05/2,UX—"<‘0.05/2"Sjf

-X

O.05/2,vXVV~X+^0.05/2-v*^X

0.05/2七SjT

X■*■^o.O5/2.vXA"AX

 

-X

~^O.O5/2,p'^XVX—"<‘0.05/2"Sjf

O.05/2,vXVV~X+^0.05/2-v*^X

 

X+^o.O5/2.vXA"AX

0.05/2七SjT

 

X~Fo・O5/2*$xV"VX+

统计推断

统计分析包括统计描述和统计推断

抽样研究:

样木信息=>总体特征

厂总体参数的估计

统计推断:

三、总体均数的估计

(1)点、(值)估"i十(pointestimation)

(2)区间估计(intervalestimation)

按照一定的概率估计总体参数可能所在的一个范围,称为区间估计。

1-a:

可信度,通常取95%或99%。

总体参数的范围可信区间(confidence

interval,CI)

总体均数的区间估计

■1、当b未知且川较小时,由于心为刍服从r分布,可按t分布原理估计总体均数的可信区间。

由于

P(-〈c

故总体均数(l・a)X100%的可信区间为

_、

X+fC"X

—.V

27

总体均数的区间估计

■2、当b未知但《足够大时(n>100),r分布近似M分布,可以《界值代替r界值,估计总体均数的可信区间.

■3、当b已知时,可按正态分布的原理,估计总体均数的可

C

-、

X'Jb门

K2

2)

信区间

某地抽取正常成年人200名,测得其血清胆固醇的均数为3・64mmol/L,标准差为1.20minol/L,估计该地正常成年人血清胆固酹均数的95%可信区间・

故该地正常成年人血清胆固醇均数的95%可信区间为

(3.47,3.81)mmol/Lo

X=3.64、S=1.20-tn=200>5^^=0.0849

(3,6411-96x0,0849)^(3-47,3,81)

(3.64±1-96X1.20)->1•288-5.992

故该地正常成年人血清胆固醇均数的95%可信区间为

(3.47,3.81)mmol/Lo

95%的可信区间的理解:

(1)我们所估计的可信区间有95%的概率包含所要估计的总体参数。

(2)从正态总体中随机抽取1()()个样本,也估计1()()个可信区间,平均约有95个可信区间包含了总体均数。

(3)但在实际工作中,只能根据一次抽样结果估计可信区间,我们就认为该区间包含了总体均数“。

2•可信区间的两个要素

(1)用可信度(1-a丿表示:

即区间包含总体均数“的理论概率大小。

(2)反映在区间的大小上。

区间愈窄愈好,如95%的可信区间比99%的可信区间要好。

总体均数的可信区间与参考值范围

■概念与意义的不同

■理论与计算方法的不同

■用途不同

■对象不同

标准差与标准误区别与联系

■意义

■计算方法

■用途

■与样本含量的关系

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 工学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1