第五章参数估计和假设检验Stata实现.docx

上传人:b****6 文档编号:8899297 上传时间:2023-02-02 格式:DOCX 页数:7 大小:18.70KB
下载 相关 举报
第五章参数估计和假设检验Stata实现.docx_第1页
第1页 / 共7页
第五章参数估计和假设检验Stata实现.docx_第2页
第2页 / 共7页
第五章参数估计和假设检验Stata实现.docx_第3页
第3页 / 共7页
第五章参数估计和假设检验Stata实现.docx_第4页
第4页 / 共7页
第五章参数估计和假设检验Stata实现.docx_第5页
第5页 / 共7页
点击查看更多>>
下载资源
资源描述

第五章参数估计和假设检验Stata实现.docx

《第五章参数估计和假设检验Stata实现.docx》由会员分享,可在线阅读,更多相关《第五章参数估计和假设检验Stata实现.docx(7页珍藏版)》请在冰豆网上搜索。

第五章参数估计和假设检验Stata实现.docx

第五章参数估计和假设检验Stata实现

第五章 参数估计和假设检验的Stata实现

本章用到的Stata命令有

可信区间计算

立即命令为

正态分布:

cii样本量样本均数样本标准差

率:

cii样本量阳性数

Poisson分布均数:

cii观察单位数观察值,p

原始数据的命令

正态分布:

ci变量

二项分布:

ci变量,b

假设检验

均数的检验:

立即命令为:

ttesti样本量样本均数样本标准差

(待检验的总体均数)

原始数据的命令:

ttest变量名=

例5-1随机抽取某地25名正常成年男子,测得其血红蛋白含量如下:

146

139

153

138

137

125

142

134

133

122

137

128

140

137

139

128

131

158

138

151

147

144

151

117

118

该样本的均数为137.32g/L,标准差为10.63g/L,求该地正常成年男子血红蛋白含量总体均数的95%可信区间。

数据格式为

 

x

1

146

2

139

3

153

4

138

5

137

6

125

7

142

8

134

9

133

10

122

11

137

12

128

13

140

14

137

15

139

16

128

17

131

18

158

19

138

20

151

21

147

22

144

23

151

24

117

25

118

计算95%可信区间的Stata命令为:

cix

计算95%可信区间

结果为

Variable|ObsMeanStd.Err.[95%Conf.Interval]

-------------+---------------------------------------------------------------

x|25137.322.126594132.9309141.7091

该地正常成年男子血红蛋白含量总体均数的95%可信区间为(132.93~141.71)

例5-2某市2005年120名7岁男童的身高

=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。

在Stata中有即时命令可以直接计算仅给出均数和标准差时的可信区间。

cii120123.624.75,level(90)

结果为:

Variable|ObsMeanStd.Err.[90%Conf.Interval]

-------------+---------------------------------------------------------------

|120123.62.4336137122.9012124.3388

该市7岁男童总体均数90%的可信区间(122.90~124.34)。

例5-3为研究铅暴露对儿童智商(IQ)的影响,某研究调查了78名铅暴露(其血铅水平≥40g/100ml)的6岁儿童,测得其平均IQ为88.02,标准差为12.21;同时选择了78名铅非暴露的6岁儿童作为对照,测得其平均IQ为92.89,标准差为13.34。

试估计铅暴露的儿童智商IQ的平均水平与铅非暴露儿童相差多少,并估计两个人群IQ的总体均数之差的95%可信区间。

本题也可以应用Stata的即时命令:

ttesti7892.8813.347888.0212.21

结果:

Two-samplettestwithequalvariances

------------------------------------------------------------------------------

|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

x|7892.881.51045813.3489.8722995.88771

y|7888.021.3825112.2185.2670790.77293

---------+--------------------------------------------------------------------

combined|15690.451.03900812.9772188.3975692.50244

---------+--------------------------------------------------------------------

diff|4.862.047637.81491798.905082

------------------------------------------------------------------------------

差值为4.86,差值的可信区间为0.81~8.90。

例5-4为研究肿瘤标志物癌胚抗原(CEA)对肺癌的灵敏度,随机抽取140例确诊为肺癌患者,用CEA进行检测,结果呈阳性反应者共62人,试估计肺癌人群中CEA的阳性率。

Stata即时命令为

cii14062

结果为

--BinomialExact--

Variable|ObsMeanStd.Err.[95%Conf.Interval]

-------------+---------------------------------------------------------------

|140.4428571.0419808.3590149.5291687

肺癌人群中CEA的阳性率为44.28%,可信区间为35.90%~52.82%。

例5-5某医生用A药物治疗幽门螺旋杆菌感染者10人,其中9人转阴,试估计该药物治疗幽门螺旋杆菌感染者人群的转阴率。

Stata即时命令为

cii109

结果为

--BinomialExact--

Variable|ObsMeanStd.Err.[95%Conf.Interval]

-------------+---------------------------------------------------------------

|10.9.0948683.5549839.9974714

例5-6某市区某年12个月发生恶性交通事故的次数分别为:

5,4,6,12,7,8,10,7,6,11,3,5

假设每个月恶性交通事故的次数服从Poisson分布,试估计该市平均每个月恶性交通事故的次数的95%可信区间。

将1个月视为一个单位时间,因Poisson分布具有可加性,我们先计算12个单位时间内平均脉冲数估计值及其95%可信区间。

X=5+4+6+12+7+8+10+7+6+11+3+5=84

由于在12个单位时间内总的发生次数为84,所以可以用

cii1284,poisson

得到结果:

--PoissonExact--

Variable|ExposureMeanStd.Err.[95%Conf.Interval]

-------------+---------------------------------------------------------------

|127.76376265.5834778.666438

例5-7续例3-4。

从某纯净水生产厂家生产的矿泉水中随机取1升水样,检出3个大肠菌群。

试估计该家生产的矿泉水中每升水中大肠杆菌数的95%可信区间。

Stata的命令为:

cii13,poisson

结果为:

--PoissonExact--

Variable|ExposureMeanStd.Err.[95%Conf.Interval]

-------------+---------------------------------------------------------------

|131.732051.61867218.767273

例5-8大规模调查表明正常成年女子的双耳在4kHz频率时的纯音气传导听阈值平均为15dB。

为研究纺机噪声对纺织女工的听力是否有影响,随机调查了20名工龄在2年以上的纺织女工,测得其听阈值(dB)如下:

10111213141416171818

18181920202322232426

研究者的问题是:

纺织女工的听阈值是否与正常成年女子不同?

Stata数据格式为:

 

x

1

10

2

11

3

12

4

13

5

14

6

14

7

16

8

17

9

18

10

18

11

18

12

18

13

19

14

20

15

20

16

23

17

22

18

23

19

24

20

26

H0:

=0,H1:

≠0。

即H0:

=15(dB),H1:

≠15(dB)。

Stata命令为:

ttestx=15

结果为:

One-samplettest

------------------------------------------------------------------------------

Variable|ObsMeanStd.Err.Std.Dev.[95%Conf.Interval]

---------+--------------------------------------------------------------------

x|2017.81.0068194.50263115.692719.9073

------------------------------------------------------------------------------

mean=mean(x)t=2.7810

Ho:

mean=15degreesoffreedom=19

Ha:

mean<15Ha:

mean!

=15Ha:

mean>15

Pr(T|t|)=0.0119Pr(T>t)=0.0060

统计量t=2.7810,Pr(|T|>|t|)=0.0119,所以可以拒绝H0,可以认为纺织女工与正常成年女子的平均听阈值的差异有统计学意义。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 小学教育 > 英语

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1