统计分析中关于p值得意义.docx

上传人:b****7 文档编号:11431325 上传时间:2023-03-01 格式:DOCX 页数:11 大小:49.62KB
下载 相关 举报
统计分析中关于p值得意义.docx_第1页
第1页 / 共11页
统计分析中关于p值得意义.docx_第2页
第2页 / 共11页
统计分析中关于p值得意义.docx_第3页
第3页 / 共11页
统计分析中关于p值得意义.docx_第4页
第4页 / 共11页
统计分析中关于p值得意义.docx_第5页
第5页 / 共11页
点击查看更多>>
下载资源
资源描述

统计分析中关于p值得意义.docx

《统计分析中关于p值得意义.docx》由会员分享,可在线阅读,更多相关《统计分析中关于p值得意义.docx(11页珍藏版)》请在冰豆网上搜索。

统计分析中关于p值得意义.docx

统计分析中关于p值得意义

T检验

主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。

  T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。

它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。

 目的:

比较样本均数所代表的未知总体均数μ和已知总体均数μ0。

  计算公式:

  t统计量:

自由度:

df=n-1

  适用条件:

  

(1)已知一个总体均数;

  

(2)可得到一个样本均数及该样本标准误;

  (3)样本来自正态或近似正态总体。

T检验的步骤[2]

  1、建立虚无假设H0:

μ1 =μ2,即先假定两个总体平均数之间没有显著差异;

  2、计算统计量t值,对于不同类型的问题选用不同的统计量计算方法;

  1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量t值的计算公式为:

  

  2)如果要评断两组样本平均数之间的差异程度,其统计量t值的计算公式为:

 

  3、根据自由度df=n-1,查t值表,找出规定的t理论值并进行比较。

理论值差异的显著水平为0.01级或0.05级。

不同自由度的显著水平理论值记为t(df)0.01和t(df)0.05

  4、比较计算得到的t值和理论t值,推断发生的概率,依据下表给出的t值与差异显著性关系表作出判断。

T值与差异显著性关系表

t

P值

差异显著程度

差异非常显著

差异显著

t < t(df)0.05

P >0.05

差异不显著

5、根据是以上分析,结合具体情况,作出结论。

 

假设

是呈正态分布的独立的随机变量(随机变量的期望值是

,方差是

)。

令:

为样本均值。

为样本方差。

它显示了数量

呈正态分布并且均值和方差分别为0和1。

另一个相关数量

T的概率密度函数是:

 等于n −1。

 T的分布称为t-分布。

参数

 一般被称为自由度。

 是伽玛函数。

分布的矩为:

假设数量A在当T呈t-分布(T的自由度为n − 1)满足

这与

是相同的

A是这个概率分布的第95个百分点

那么

等价于

因此μ的90%置信区间为:

下表列出了自由度为

的t-分布的单侧和双侧区间值。

例如,当样本数量n=5时,则自由度

=4,我们就可以查找表中以4开头的行。

该行第5列值为2.132,对应的单侧值为95%(双侧值为90%)。

这也就是说,T小于2.132的概率为95%(即单侧),记为Pr(−∞ < T < 2.132) = 0.95;同时,T值介于-2.132和2.132之间的概率为90%(即双侧),记为Pr(−2.132 < T < 2.132) = 0.9。

这是根据分布的对称性计算得到的,

Pr(T < −2.132) = 1 − Pr(T > −2.132)=1 − 0.95=0.05,

因此,

Pr(−2.132 < T < 2.132)=1 − 2(0.05)=0.9.

注意关于表格的最后一行的值:

自由度为无限大的t-分布和正态分布等价。

单侧

75%

80%

85%

90%

95%

97.5%

99%

99.5%

99.75%

99.9%

99.95%

双侧

50%

60%

70%

80%

90%

95%

98%

99%

99.5%

99.8%

99.9%

1

1.000

1.376

1.963

3.078

6.314

12.71

31.82

63.66

127.3

318.3

636.6

2

0.816

1.061

1.386

1.886

2.920

4.303

6.965

9.925

14.09

22.33

31.60

3

0.765

0.978

1.250

1.638

2.353

3.182

4.541

5.841

7.453

10.21

12.92

4

0.741

0.941

1.190

1.533

2.132

2.776

3.747

4.604

5.598

7.173

8.610

5

0.727

0.920

1.156

1.476

2.015

2.571

3.365

4.032

4.773

5.893

6.869

6

0.718

0.906

1.134

1.440

1.943

2.447

3.143

3.707

4.317

5.208

5.959

7

0.711

0.896

1.119

1.415

1.895

2.365

2.998

3.499

4.029

4.785

5.408

8

0.706

0.889

1.108

1.397

1.860

2.306

2.896

3.355

3.833

4.501

5.041

9

0.703

0.883

1.100

1.383

1.833

2.262

2.821

3.250

3.690

4.297

4.781

10

0.700

0.879

1.093

1.372

1.812

2.228

2.764

3.169

3.581

4.144

4.587

11

0.697

0.876

1.088

1.363

1.796

2.201

2.718

3.106

3.497

4.025

4.437

12

0.695

0.873

1.083

1.356

1.782

2.179

2.681

3.055

3.428

3.930

4.318

13

0.694

0.870

1.079

1.350

1.771

2.160

2.650

3.012

3.372

3.852

4.221

14

0.692

0.868

1.076

1.345

1.761

2.145

2.624

2.977

3.326

3.787

4.140

15

0.691

0.866

1.074

1.341

1.753

2.131

2.602

2.947

3.286

3.733

4.073

16

0.690

0.865

1.071

1.337

1.746

2.120

2.583

2.921

3.252

3.686

4.015

17

0.689

0.863

1.069

1.333

1.740

2.110

2.567

2.898

3.222

3.646

3.965

18

0.688

0.862

1.067

1.330

1.734

2.101

2.552

2.878

3.197

3.610

3.922

19

0.688

0.861

1.066

1.328

1.729

2.093

2.539

2.861

3.174

3.579

3.883

20

0.687

0.860

1.064

1.325

1.725

2.086

2.528

2.845

3.153

3.552

3.850

21

0.686

0.859

1.063

1.323

1.721

2.080

2.518

2.831

3.135

3.527

3.819

22

0.686

0.858

1.061

1.321

1.717

2.074

2.508

2.819

3.119

3.505

3.792

23

0.685

0.858

1.060

1.319

1.714

2.069

2.500

2.807

3.104

3.485

3.767

24

0.685

0.857

1.059

1.318

1.711

2.064

2.492

2.797

3.091

3.467

3.745

25

0.684

0.856

1.058

1.316

1.708

2.060

2.485

2.787

3.078

3.450

3.725

26

0.684

0.856

1.058

1.315

1.706

2.056

2.479

2.779

3.067

3.435

3.707

27

0.684

0.855

1.057

1.314

1.703

2.052

2.473

2.771

3.057

3.421

3.690

28

0.683

0.855

1.056

1.313

1.701

2.048

2.467

2.763

3.047

3.408

3.674

29

0.683

0.854

1.055

1.311

1.699

2.045

2.462

2.756

3.038

3.396

3.659

30

0.683

0.854

1.055

1.310

1.697

2.042

2.457

2.750

3.030

3.385

3.646

40

0.681

0.851

1.050

1.303

1.684

2.021

2.423

2.704

2.971

3.307

3.551

50

0.679

0.849

1.047

1.299

1.676

2.009

2.403

2.678

2.937

3.261

3.496

60

0.679

0.848

1.045

1.296

1.671

2.000

2.390

2.660

2.915

3.232

3.460

80

0.678

0.846

1.043

1.292

1.664

1.990

2.374

2.639

2.887

3.195

3.416

100

0.677

0.845

1.042

1.290

1.660

1.984

2.364

2.626

2.871

3.174

3.390

120

0.677

0.845

1.041

1.289

1.658

1.980

2.358

2.617

2.860

3.160

3.373

0.674

0.842

1.036

1.282

1.645

1.960

2.326

2.576

2.807

3.090

3.291

,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。

p值是将观察结果认为有效即具有总体代表性的犯错概率。

如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。

即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。

(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。

)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。

在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。

换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。

实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。

通常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。

结果0.05≥p>0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具有高度统计学意义。

但要注意这种分类仅仅是研究基础上非正规的判断常规。

所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。

这些检验一般都要求:

所分析变量在总体中呈正态分布,即满足所谓的正态假设。

许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。

当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。

这种条件下有两种方法:

一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。

另一种方法是:

当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。

后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。

即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。

如果P<0.01,说明是较强的判定结果,拒绝假定的参数取值。

如果0.01

如果P值>0.05,说明结果更倾向于接受假定的参数取值。

可是,那个年代,由于硬件的问题,计算P值并非易事,人们就采用了统计量检验方法,也就是我们最初学的t值和t临界值比较的方法。

统计检验法是在检验之前确定显著性水平α,也就是说事先确定了拒绝域。

但是,如果选中相同的α,所有检验结论的可靠性都一样,无法给出观测数据与原假设之间之间不一致程度的精确度量。

只要统计量落在拒绝域,假设的结果都是一样,即结果显著。

但实际上,统计量落在拒绝域不同的地方,实际上的显著性有较大的差异。

因此,随着计算机的发展,P值的计算不再是个难题,使得P值变成最常用的统计指标之一。

为理解P值的计算过程,用Z表示检验的统计量,ZC表示根据样本数据计算得到的检验统计量值。

左侧检验H0:

μ≥μ0vsH1:

μ<μ0

P值是当μ=μ0时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值=P(ZC≤Z|μ=μ0)

右侧检验H0:

μ≤μ0vsH1:

μ>μ0

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值=P(ZC≥Z|μ=μ0)

双侧检验H0:

μ=μ0vsH1:

μ≠μ0

P值是当μ=μ0时,检验统计量大于或等于根据实际观测样本数据计算得到的检验统计量值的概率,即p值=2P(ZC≥|Z||μ=μ0)

P值是论文中最常用的一个统计学指标,可是其误用、解释错误的现象却很常见。

因此,很有必要说明p值的意义、用法及常见错误。

P值指的是比较的两者的差别是由机遇所致的可能性大小。

P值越小,越有理由认为对比事物间存在差异。

例如,P<0.05,就是说结果显示的差别是由机遇所致的可能性不足5%,或者说,别人在同样的条件下重复同样的研究,得出相反结论的可能性不足5%。

P>0.05称“不显著”;P<=0.05称“显著”,P<=0.01称“非常显著”。

由于常用“显著”来表示P值大小,所以P值最常见的误用是把统计学上的显著与临床或实际中的显著差异相混淆,即混淆“差异具有显著性”和“具有显著差异”二者的意思。

其实,前者指的是p<=0.05,即说明有充分的理由认为比较的二者来自同一总体的可能性不足5%,因而认为二者确实有差异,下这个结论出错的可能性<=5%。

而后者的意思是二者的差别确实很大。

举例来说,4和40的差别很大,因而可以说是“有显著差异”,而4和4.2差别不大,但如果计算得到的P值<=0.05,则认为二者“差别有显著性”,但是不能说“有显著差异”。

由于“有显著差异”和“差异具有显著性”容易混淆,因而现在有些期刊提倡用“差异有统计意义”来代替“差异有显著性”,用“差异无统计意义”、“差异有高度统计意义”来代替“差异不显著”和“差异有高度显著性”。

例如《中华胃肠外科学》即是如此。

如果P>5%,是否我们就可以下结论说比较的二者没有差别呢?

不能。

P>5%只能说明没有充分的证据说明二者确有差别,但是也不能说二者没有差别或差别很小。

在这两个极端之间还有一个过渡区间,即无论下有差别还是没有差别或差别很小的证据都不足。

要推断二者没有差别或差别很小,需要采用等效检验的统计推断方法。

 

 

结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。

专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。

p值是将观察结果认为有效即具有总体代表性的犯错概率。

如p=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。

即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。

(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。

)在许多研究领域,0.05的p值通常被认为是可接受错误的边界水平。

 

显著性差异(significancelevel),是一个统计学名词。

它是统计学(Statistics)上对数据差异性的评价。

当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的,如比-西一般能力测验中,大学学历被试组的成绩与小学学历被试组会有显著性差异。

也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。

例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异,这一差异很可能来自于学××记忆法对被试记忆能力的改变。

显著性差异是一种有量度的或然性评价。

比如,我们说A、B两数据在.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为95%。

两个数据所代表的样本还有5%的可能性是没有差异的。

这5%的差异是由于随机误差造成的。

通常情况下,实验结果达到.05水平或.01水平,才可以说数据之间具备了显著性差异。

在作结论时,应确实描述方向性(例如显著大于或显著小于)。

如果我们是检验某实验(HypothesisTest)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(NullHypothesis)就可被推翻,对立假设(AlternativeHypothesis)得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。

(2)P值的计算:

一般地,用X表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。

具体地说:

左侧检验的P值为检验统计量X小于样本统计值C的概率,即:

P=P{X

右侧检验的P值为检验统计量X大于样本统计值C的概率:

P=P{X>C}

双侧检验的P值为检验统计量X落在样本统计值C为端点的尾部区域内的概率的2倍:

P=2P{X>C}(当C位于分布曲线的右端时)或P=2P{X

若X服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P值可表示为P=P{|X|>C}。

计算出P值后,将给定的显著性水平α与P值比较,就可作出检验的结论:

如果α>P值,则在显著性水平α下拒绝原假设。

如果α≤P值,则在显著性水平α下接受原假设。

在实践中,当α=P值时,也即统计量的值C刚好等于临界值,为慎重起见,可增加样本容量,重新进行抽样检验。

P值

碰巧的概率

对无效假设

统计意义

P>0.05

碰巧出现的可能性大于5%

不能否定无效假设

两组差别无显著意义

P<0.05

碰巧出现的可能性小于5%

可以否定无效假设

两组差别有显著意义

P<0.01

碰巧出现的可能性小于1%

可以否定无效假设

两者差别有非常显著意义

⑴P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。

因此,与对照组相比,C药取得P<0.05,D药取得P<0.01并不表示D的药效比C强。

⑵P>0.05时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成立。

在药效统计分析中,更不表示两药等效。

哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。

⑶统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P<0.001,无此必要。

⑷显著性检验只是统计结论。

判断差别还要根据专业知识。

抽样所得的样本,其统计量会与总体参数有所不同,这可能是由于两种原因。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 广告传媒

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1