23离群值的判定与处置Word文档下载推荐.docx

上传人:b****2 文档编号:13650889 上传时间:2022-10-12 格式:DOCX 页数:36 大小:356.19KB
下载 相关 举报
23离群值的判定与处置Word文档下载推荐.docx_第1页
第1页 / 共36页
23离群值的判定与处置Word文档下载推荐.docx_第2页
第2页 / 共36页
23离群值的判定与处置Word文档下载推荐.docx_第3页
第3页 / 共36页
23离群值的判定与处置Word文档下载推荐.docx_第4页
第4页 / 共36页
23离群值的判定与处置Word文档下载推荐.docx_第5页
第5页 / 共36页
点击查看更多>>
下载资源
资源描述

23离群值的判定与处置Word文档下载推荐.docx

《23离群值的判定与处置Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《23离群值的判定与处置Word文档下载推荐.docx(36页珍藏版)》请在冰豆网上搜索。

23离群值的判定与处置Word文档下载推荐.docx

(六)剔除水平

为检出离群值是不是高度离群而指定的统计查验的显著性水平。

(剔除水平的值应不超过检出水平的值,除非还有约定,值应为)。

二、离群值产生缘故与判定

(一)离群值产生的缘故

离群值按产生缘故分为两类:

1.第一类离群值是整体固有变异性的极端表现,这种离群值与样本中其余观测值属于同一整体;

2.第二类离群值是由于实验条件和实验方式的偶然偏离所产生的结果,或产生于观测、记录、计算中的失误,这种离群值与样本中其余观测值不属于同一整体。

如:

测量者工作责任心不强,工作过于疲劳,对仪器熟悉与把握程度不够等缘故,引发操作不妥,或在测量进程中不警惕、不耐心、不认真等,从而造成错误的读数或错误的记录;

由于测量条件的意外转变,引发仪器示值或被测对象位置的改变而产生粗大误差。

如机械冲击、外界震动、电网供电电压突变、电磁干扰等环境条件意外地改变等,引发仪器示值或被测对象位置的改变而产生粗大误差;

测量仪器内部的突然故障。

如机械部件突然破损、电子元器件突然失效等。

(二)离群值的判定

对离群值的判定通常可依照技术上或物理上的理由直接进行,例如当实验者已经明白实验偏离了规定的实验方式,或测量仪器发生问题等。

当这些理由不明确时,可利用规定的方式判定。

由于数据的散布形式不同,如正态散布、指数散布、持续型(Ⅰ型)散布等,判定离群值的方式方式也有不同,本书只就正态散布情形进行讨论。

三、离群值的情形与判定程序

(一)离群值的情形

依照GB/T4883规定,离群值有三种情形:

1.上侧情形:

依如实际情形或以往体会,离群值都为高端值;

2.下侧情形:

依如实际情形或以往体会,离群值都为低端值;

3.双侧情形:

依如实际情形或以往体会,离群值既可为高端值,也可为低端值。

上侧情形和下侧情形统称为单侧情形;

当无法确以为单侧情形的,按双侧情形处置。

(二)离群值的判定程序

1.单个离群值的判定程序

(1)依实际情形或以往的体会选定适宜的查验规那么;

(2)确信适当的显著性水平;

(3)依照显著性水平及样本量,确信查验的临界值;

(4)由观测值计算相应统计量的值,依照计算所得统计量的值与临界值的比较结果作出判定。

2.多个离群值的判定程序

当存在多个离群值时,重复利用上述程序进行查验。

假设没有发觉离群值,那么整个查验判定工作终止;

假设检出离群值,当检出的离群值总数超过上限时,应停止查验,对样本应慎重处置,不然,采纳相同的检出水平和相同的规那么,对除去已检出的离群值后余下的观测值继续查验。

四、离群值处置的方式与规那么

(一)离群值处置的方式

离群值处置的方式有:

1.保留离群值并用于后续数据处置;

2.在找到实际缘故时修正离群值,不然予以保留;

3.剔除离群值,不追加观测值;

4.剔除离群值,并追加新的观测值或用适宜的插补值代替。

(二)离群值的处置规那么

关于检出的离群值,应尽可能寻觅技术上和物理上的缘故,作为处置离群值的依据。

应依如实际问题的性质,综合衡量寻觅和判定产生离群值的缘故所付出的代价、正确判定离群值的收益和错误剔除正常观测值的风险,以确信实施下述规那么之一:

1.假设在技术上或物理上找到了产生离群值的缘故,那么应剔除或修正;

假设未找到产生离群值的技术上或物理上的缘故,那么不得剔除或进行修正。

2.假设在技术上或物理上找到产生离群值的缘故,那么应剔除或修正;

不然,保留岐离值,剔除或修正统计离群值;

在重复利用同一查验规那么查验多个离群值的情形,每次检出离群值后,都要再查验它与否为统计离群值。

假设某次检出的离群值为统计离群值,那么此离群值及在它前面检出的离群值(含岐离值)都应被剔除或修正。

3.检出的离群值(含岐离值)都应被剔除或修正。

4.备案

被剔除或修正的观测值及其理由应予以记录,以备查询。

§

2离群值判定规那么(重点)

本节要紧依据GB/T4883—2020《数据的统计处置和说明正态样本离群值的判定和处置》的规定,介绍整体标准差已知(用σ)和未知(用s)两种情形下离群值的查验判定方式。

一、已知标准差(用σ)情形离群值的判定规那么——奈尔查验法

当已知标准差时,利用奈尔查验法,奈尔查验法的样本量。

假设对某标准差为的量进行检测,检测次数为,检测值为:

①对样本检测数值按从小到大顺序从头排列:

,为发觉离群值,按下述规那么判定:

(一)上侧情形

如疑心最大值为离群值,那么按下述步骤进行判定:

1.计算算术平均值

2.计算统计量

(4—1)

式中:

——整体标准差;

——样本均值。

3.确信检出水平,从表4—1中查出临界值;

4.依照计算统计量和临界值的关系进行判定:

当时,判定为离群值;

不然判定未发觉是离群值;

5.关于检出的离群值,确信剔除水平,从表4—1中查出临界值。

那么:

当时,判定为统计离群值,不然判定未发觉是统计离群值,即为歧离值。

(二)下侧情形

假设疑心最小值为离群值,那么按以下步骤判定:

(4—2)

4.依照统计量与临界值的关系作出判定:

当时,判定最小值为离群值,不然判定未发觉是离群值;

(三)双侧情形

假设疑心、为离群值,按以下步骤进行判定:

1.别离计算统计量、的值;

2.确信检出水平,从表4—1中查出临界值;

3.依照、与临界值的关系作出判定:

(1)当,且时,判定最大值为离群值,不然判定未发觉是离群值;

(2)当,且时,判定最小值为离群值,不然判定未发觉是离群值;

(3)当时,同时对最大值和最小值进行查验。

当时,判定最大值为离群值,不然判定未发觉是离群值;

当时,判定最小值为离群值,不然判定未发觉是离群值;

4.关于检出的离群值或,确信剔除水平,从表4—1中查出临界值,

当时,判定为统计离群值,不然判未发觉是统计离群值,即为歧离值;

当时,判定为统计离群值,不然判定未发觉是统计离群值,即是歧离值。

表4—1奈尔查验临界值

3

32

4

33

5

34

6

35

7

36

8

37

9

38

10

39

11

40

12

41

13

42

14

43

15

44

16

45

17

46

18

47

19

48

20

49

21

50

22

51

23

52

24

53

25

54

26

55

27

56

28

57

29

58

30

59

31

60

【例4—1】对某量进行检测,其检测数据如下:

,,,,,,,,,。

假设测量中系统误差已经排除,测量服从正态散布,已知,试用奈尔查验法判定离群值的存在()。

解:

1.第一对检测数据按从小到大顺序从头排列:

那么。

2.计算算术平均值:

3.计算统计量:

4.查表4—1得临界值,。

因为,故判定不是离群值。

再判定是不是为离群值

1.计算统计量:

2.依照检出水平,查表得临界值。

二、未知标准差情形离群值的判定规那么

在标准差未知的情形下,若是检出离群值的个数不超过1时,可利用格拉布斯查验法和狄克逊查验法;

当检出离群值个数超过1时,可重复利用狄克逊查验法、偏度—峰度查验法和格拉布斯查验法。

(一)格拉布斯查验法

假设对某量进行检测,标准差未知,测量次,检测值为:

对样本检测数值按从小到大顺序排列:

,为发觉离群值,利用格拉布斯查验法按下述步骤判定:

1.上侧情形

(1)计算算术平均值和实验标准差

(2)计算出统计量

(4—3)

(3)确信检出水平,查表4—2,查出格拉布斯临界值;

(4)依照计算的统计量和临界值的关系进行判定。

当时,判定为离群值,不然判定未发觉是离群值;

(5)关于检出的离群值,确信剔除水平,在表4—2种查出临界值,

2.下侧情形

(1)依照算术平均值和实验标准差,计算统计量

(4—4)

(2)确信检出水平,查表4—2查出格拉布斯临界值;

(3)依照计算的统计量和临界值的关系进行判定。

(4)关于检出的离群值,确信剔除水平,在表4—2种查出临界值,

3.双侧情形

(1)依照算术平均值和实验标准差,计算统计量和

(3)依照计算统计量、和临界值的关系进行判定:

当,且时,判定为离群值,不然判定未发觉是离群值;

当时,应从头考虑限定检出离群值的个数。

(4)关于检出的离群值或,确信剔除水平,查表4—2查出临界值,并依照统计量、的值进行比较判定:

当时,判定为统计离群值,不然判定未发觉是统计离群值,即为岐离值;

当时,判定为统计离群值,不然判

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 院校资料

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1