家用电器故障实时检测.docx
《家用电器故障实时检测.docx》由会员分享,可在线阅读,更多相关《家用电器故障实时检测.docx(33页珍藏版)》请在冰豆网上搜索。
家用电器故障实时检测
家用电器故障实时检测
摘要
家用电器故障的实时检测,是为了防止随着时间的推移,电器的老化使其工作能力衰减明显化后,用户再提出需要维修,此时电器的故障情况已经非常严重,为了保证用户的体验效果,电器运行状况的监测并判别就显现出重要性。
针对问题一,首先应明确复杂环境,对读取的数据进行预处理,各选取A,B中正常与故障参数中数据一致的参数进行筛选,得到已筛选表。
将已筛选表中文字进行数值化处理,得到已替换表。
利用拉依达准则(pautacriterion)对已替换表进行异常值判断,用Matlab得到异常值的行数,将异常值剔除,最终确定已剔除表。
针对问题二,对已经预处理过的数据使用SPSS分析得出各个参数相关性系数表,筛选相关性系数强的参数。
再经过描述性分析得到A环境下与B环境下正常和故障工作的参数的描述性统计量,根据极大极小值相对正常均值的波动范围,引入参数的增长率
概念。
计算各个参数增长率,使用Excel对增长率排序,得到对故障判断权重较大的参数。
统一相关性系数分析与权重分析,确定最终参数值。
并以正常数据的参数增长率区间作标准建立模型,定义新的变量故障程度
,根据故障程度是否在增长率区间内判断电器是否故障,经检验,此模型适用于附件一。
针对问题三,我们首先使用问题二中的模型对附件二进行验证,由结果可知模型仍成立。
但此模型附件三无法验证,所以我们对模型进行了修正,引出电器在正常工作情况下的拟合均值与拟合增长率区间来判断电器是否故障。
经计算D,E的故障程度,可得出D为正常工作,E为故障。
针对问题四,我们在做模型判断时,认为会出现误判,并且认为把故障判断为正常更应该避免。
为了嵌入因子我们可以将更多环境下正常工作参数作依据定义一个更为适用的复杂环境的拟合均值与拟合区间
,从而计算更为精确的故障程度
进行判断。
针对问题五,为了减小模型的计算量,我们对数据进行了取参数和分层抽样的方法。
第一,对工作环境D,E数据分层抽样,对各工作环境下分别抽取行数为5、10的倍数的行组成4个新矩阵,运用问题三中数据处理方法,得到新矩阵的故障程度通过拟合增长率区间判断得出结果与问题三中一致。
第二,对工作环境A、B正常情况主要参数分别进行增长率排序,各取出增长率为前五的参数,求并集,最终简化为7个重要参数,相同方法判断,得出与问题三中结果一致。
第三,对数据取7个重要参数,进行5、10倍数的分层抽样,得到四组新数据,相同方法判断,得出与问题三中结果一致。
因此确定数据简化为取参数1、2、4、5、10、18、83,并对数据进行10倍数的分层抽样的方法确定为运算简化方法。
关键词:
拉依达准则、增长率、故障程度、拟合均值、拟合增长率区间
一、问题重述
家用电器早已成为我们生活中必不可少的用品,它对我们的生活提供了极大地帮助,方便了人们的生活,为人们的娱乐和休闲节省了更多的时间。
但是随着时间和过程的使用,它会发生老化和故障,从而打乱我们的生活。
因此及时排除家用电器故障就显得尤为重要了。
问题1:
复杂的环境会导致家用电器的传感器读取到异常数值,因此我们需要寻找一定的方法发现异常数据并给出其解决方案。
问题2:
分析附件一中不同参数之间的相关性并确定其对故障的影响程度,建立模型并对附件一中数据进行判断与处理。
问题3:
通过分析附件一中所建立的模型是否同样也适用于附件二,如果适用于附件二,则可按照附件一同样的方法进行故障判断;如果不适用,则对模型进行改进,并用改进后的模型对附件三中D、E两种工作环境下的电器进行故障判断。
问题4:
判断所建立的模型得到的结果是否会出现误判现象,如果出现误判现象,是将正常判断为故障,还是将故障判断为正常,哪种情况可以避免。
并且嵌入一个影响因子得出解决方案。
问题5:
在现实生活中,家用电器控制器的计算能力是有限的,可能无法对大数据进行计算,因此需要我们在保证判断精确的前提下对计算方法或数据进行简化,降低计算复杂程度,提出解决方案。
二、模型假设
1.在一定环境下家用电器正常工作时,可认为输出的数据真实可靠。
2.假设已得到的数据可以反映家电的运行状态。
3.在一定环境下,正常与故障数据一致的参数对故障判断无影响。
三、符号说明
:
表示第i行第j列的数据
:
标准序列的算术平均值
:
实测数据与均值的残差绝对值
:
标准序列的方差
;实测参数样本的平均值
:
实测参数样本的残差
:
实测参数样本的标准差
:
拟合均值的矩阵
:
A环境下正常工作的均值
:
B环境下正常工作的均值
:
A环境下处理过后数据的个数
:
B环境下处理过后数据的个数
:
某工作环境下该参数的极大值
:
某工作环境下该参数的极小值
:
所处环境下的故障均值
:
某工作环境下模型计算出来总体参数反映值
:
所给区间的下限
:
所给区间的上限
:
增长率
:
第i个参数总拟合均值
:
对应环境下第i个参数的最大值
:
对应环境下第i个参数的最小值
:
A环境下的拟合下限
:
A环境下的拟合上限
:
总拟合区间的下限
:
总拟合区间的上限
:
实际均值
四、模型的建立与求解
4.1问题一
4.1.1问题一的分析
在已知复杂环境的情况下,通过对大量数据分析,首先进行预处理,通过查阅资料可知,剔除数据异常值的方法有拉依达准则、格拉布斯准则等方法。
由于拉依达准则只有在测量次数n较大时才可以使用,至少使n>10次才可以,根据分析,适用于本题中的大数据异常值剔除处理,且拉依达准则方法比较简单,数据好处理,较为精确,因此我们借助这种思想对附件中数据进行处理。
第一,给的数据进行预处理,预处理的方法是在同一环境下,对家用电器正常工作与故障时相同参数的数据进行对比,找出在电器正常工作和故障时参数数据一致的参数,将这些参数筛去,剩余参数作为已筛选数据进行整理,得到A、B工作环境下的已筛选表。
第二,对已筛选表中带有文字的参数转为数字参数处理,以方便数据分析。
其中,对于参数一,关记为0,开记为1;对于参数73,关记为0,低速记为1,高速记为2,超高速记为3;对于其余参数,正常记1,故障或者限记为0。
将数值化后的各个参数数据进行整理,得到A、B工作环境下的已替换表。
第三,根据拉依达准则,对已替换表中的数据进行异常数据剔除处理。
数据处理过程中,首先用SPSS软件对已替换表中数据进行统计量描述,得到其均值和标准差。
再运用Matlab软件编程,得到剔除数据的行数,对已替换表进行异常数据剔除处理,将剔除后的数据进行整理,得到A、B工作环境下的已剔除表。
拉依达准则具体算法如下:
、按列计算剩余数据的算术平均值
通过这个公式计算出每列数据的算术平均值
、按列计算剩余数据的标准差
然后得到这些数据的标准差
、判断数据的异常
符合这个公式,则说明数据异常,反之,数据正常。
4.2问题二
4.2.1问题二的分析
根据问题2要求,我们对附件一中剔除后的数据进行不同参数的相关性分析,确定它们的相关程度,同时为确定参数对于故障判别的重要程度,进行权重分析。
并根据主要参数建立模型,根据模型对附件一中A、B工作环境下的数据进行故障判别处理。
对A、B工作环境下已剔除表进行SPSS相关系数分析,同时引入参数增长率概念进行权重分析,详情如下:
1、相关性分析:
主要运用SPSS软件进行数据处理,由于事件的随机性,利用泊松(pearson)分布进行相关性分析,得到相关性系数。
通过查阅资料,可得泊松分布的相关性系数标准为0.4(弱相关)、0.6(中等强度相关)、0.8(强相关),利用这个标准对A、B两种正常工作环境下的各个参数进行划分。
得到:
A正常工作环境下,0.4的参数有:
1、2、3、4、5、7、8、9、10、18、60、72、73、80、83,0.6的参数有1、2、3、4、5、7、8、9、10、18、60、72、73、80、83,0.8的参数有1、2、3、4、5、7、10、18、60、72、73、80。
B正常工作环境下,0.4的参数有:
1、2、3、4、5、7、8、9、10、18、24、60、72、73、78、80、83,0.6的参数有1、2、3、4、5、7、9、10、18、24、60、72、73、78、80,0.8的参数有1、2、3、4、5、10、18、24、60、72、73、78、80。
将不同环境下得到的相关性较强的参数进行对比分析,初步得到1、2、3、4、5、10、18、60、72、73、80作为参数。
相关系数表见附录4。
2、权重分析:
在权重分析时,我们引入了增长率的概念。
增长率定义为故障均值与正常均值的差的绝对值与正常均值的比值,表示故障均值相对于正常均值的波动情况。
具体方法为:
用SPSS软件对附件一中A、B工作环境下正常和故障的已剔除表进行统计量描述,计算出其正常均值与故障均值,从而计算出增长率,增长率公式如下:
:
某正常工作环境下的均值
:
所处环境下的故障均值
:
增长率
波动越大,影响程度越大,因此我们取波动范围大于10%的参数作为参数判别依据,得到工作环境A中对故障判别的重要参数为1、2、3、4、5、6、9、10、18、43、60、72、83;工作环境B中对故障判别的重要参数为1、2、3、4、5、6、10、18、24、60、72、73、74、75、78、80、83。
对A、B中重要参数取交集,得到权重较大的参数为:
1、2、3、4、5、10、18、60、72、83。
3、通过对相关性分析和权重比较,可以得出,通过相关性大小取得的参数值与权重取得的参数值由很大的相似程度,由于建立电器故障判别模型的过程中,对故障判别影响较大的参数应作为主要的判别依据,因此以权重分析为主,最终确定模型分析的参数为1、2、3、4、5、10、18、60、72、83。
并将A、B工作环境下剔除表中的重要参数取出进行整理,作为新的已剔除表,用于下列数据分析。
运用SPSS软件对上列新的已剔除表进行统计量描述,得到各个重要参数的极大极小值以及均值,然后计算该环境下正常数值的波动范围,来判断电器故障情况。
具体算法如下:
,
,得到增长率区间为
。
然后,我们引入了故障程度概念,故障程度为
计算出故障均值相对于正常均值的故障程度,判断故障程度值是否在增长率区间内。
在,说明机器正常;不在,说明机器故障。
计算过程结果如下:
A环境正常工作参数计算表
参数
极小值
极大值
均值
增长率平方
参数1
0
1
0.11
1
65.46280992
参数2
0
1
0.11
1
65.46280992
参数3
0
68
5.92
1
109.9663988
参数4
0
900
97.72
1
67.40389836
参数5
0
832
69.08
1
121.9700895
参数10
29
78
38.95
0.065257621
1.00514138
参数18
0
3
0.262
1
109.2104772
参数60
35
55
39.41
0.012521729
0.156487395
参数72
0
1
0.11
1
65.46280992
参数83
0.4
0.86
0.59
0.103705832
0.20942258
求和
7.181485182
606.310345
区间
2.67982932
24.6233699
注:
增长率区间为(2.679829,24.62337)
表1:
A环境正常工作参数计算表
A环境故障参数计算表
参数
故障均值
正常均值
增长率平方
参数1
0.64
0.11
23.21487603
参数2
1
0.11
65.46280992
参数3
31.5
5.92
18.67057387
参数4
603.62
97.72
26.8017062
参数5
124.97
69.08
0.654581251
参数10
74.51
38.95
0.833505712
参数18
0.682
0.262
2.569780316
参数60
46.93
39.41
0.036410179
参数72
1
0.11
65.46280992
参数83
45.26
0.59
5732.286412
求和
5935.993465
算术平方根
77.04539873
注:
此值不在区间中。
表2:
A环境故障参数计算表
使用建立的模型,通过验证附件一中工作环境A的故障参数数据,结果可知建立的模型具有一定的可行性,继续验证B。
B环境正常工作参数计算表
参数
极小值
极大值
均值
增长率平方
参数1
0
1
0.11
0.923106498
1
参数2
0
1
0.11
0.923106498
1
参数3
0
68
5.92
5.86347772
1
参数4
0
900
97.72
0.877313271
1
参数5
0
832
69.08
6.52565588
1
参数10
29
78
38.95
0.083857274
0.088656735
参数18
0
3
0.262
6.563269103
1
参数60
35
55
39.41
0.009112928
0.019398953
参数72
0
1
0.11
0.923106498
1
参数83
0.4
0.86
0.59
0.021617278
0.014269051
求和
22.71362295
7.12232474
区间
4.76588113
2.668768394
注:
增长率区间为(2.668768,4.765881)
表3:
B环境正常工作参数计算表
B环境故障参数计算表
参数
故障均值
正常均值
增长率平方
参数1
0.33
0.51
0.124567474
参数2
0.57
0.51
0.01384083
参数3
14.85
19.29
0.052978723
参数4
324.57
464.72
0.090950162
参数5
71.7
279.08
0.552174456
参数10
59.7
78.32
0.056521541
参数18
0.392
1.123
0.423716368
参数60
54.34
63.9
0.022382782
参数72
0.57
0.51
0.01384083
参数83
0.4568
0.8631
0.221600845
求和
1.572574012
算术平方根
1.254023131
注:
此值不在区间中
表4:
B环境故障参数计算表
通过计算我们发现故障均值求出的故障程度不在这个增长率区间之内,由此可判断在A、B环境下此模型具有一定的可行性。
4.3问题三
4.3.1问题三的分析
首先我们想通过利用附件一所建立的模型去验证附件二中的故障数据,因为其参数在所处环境下有其正常值与故障值。
可是此模型在附件三中不适用,因为在D、E所处环境下只有其工作参数,没有正常工作的均值作为标准去衡量。
因此,我们引入了拟合均值的概念,并使用拟合均值作为D、E环境的均值,并使用A、B环境下正常工作的各参数极大极小值求出拟合增长率区间作为判断依据。
首先剔除异常数据,然后从附件二、三中提取出主成分因子参数1、参数2、参数3、参数4、参数5、参数10、参数18、参数60、参数72、参数83。
确定出这些参数之后,使用SPSS分析附件二与三中的数据得到描述性统计量。
1、对于附件二的求解
对于附件二中的参数处理我们使用问题二建立的模型来求解。
C环境正常工作参数计算表
参数
极小值
极大值
均值
增长率平方
参数1
0
1
0.46
1
1.378071834
参数2
0
1
0.51
1
0.923106498
参数3
0
57
16.29
1
6.245396796
参数4
0
900
421.62
1
1.287370702
参数5
0
832
227.54
1
7.056992017
参数10
53
99
75.3
0.087704075
0.09906192
参数18
0
3.5
0.85
1
9.719723183
参数60
55
70
61.5
0.0111706
0.019102386
参数72
0
1
0.51
1
0.923106498
参数83
0.77
0.85
0.8155
0.003112969
0.001789741
求和
7.101987644
27.65372157
区间
2.664955468
5.258680592
增长率区间为(2.664955,5.258681)
表5:
C环境正常工作参数计算表
C环境故障参数计算表
参数
故障均值
正常均值
增长率平方
参数1
0.22
0.46
0.27221172
参数2
283.44
0.51
307763.8789
参数3
11.41
16.29
0.089742358
参数4
213.99
421.62
0.24251455
参数5
58.78
227.54
0.55007705
参数10
63.2
75.3
0.02582146
参数18
0.325
0.85
0.381487889
参数60
49.78
61.5
0.036316584
参数72
0.31
0.51
0.153787005
参数83
0.4719
0.8155
0.177524533
求和
307765.8084
算术平方根
554.7664449
此值不在区间中
表6:
C环境故障参数计算表
由此可知,问题二的模型仍然适用于附件二,模型继续使用。
2、对于附件三的求解
首先引入拟合的概念,定义拟合均值为
表示参数
的均值,再使用模型根据拟合均值与工作环境A、B正常工作的极大值,极小值进行区间拟合,得到拟合区间。
对于附件三,使用描述性表格中的均值与拟合均值使用模型计算,得到
,进行判断。
以拟合均值作为D、E两种正常工作环境的均值。
以
,
作为D、E两种工作环境下的阈值,从而确定所给附件三中D、E所处的工作状态。
A工作环境正常情况下计算表格(拟合均值)
参数
极小值
极大值
拟合均值
增长率平方
参数1
0
1
0.311500077
1
4.885302687
参数2
0
1
0.311500077
1
4.885302687
参数3
0
68
12.65514006
1
19.12584683
参数4
0
900
282.5963202
1
4.773153733
参数5
0
832
174.8675402
1
14.12171487
参数10
29
78
58.78264503
0.256701427
0.106878162
参数18
0
3
0.695728915
1
10.96950509
参数60
35
55
51.74684219
0.104736523
0.003952233
参数72
0
1
0.311500077
1
4.885302687
参数83
0.4
0.86
0.727574177
0.202705141
0.033127663
求和
7.564143091
63.79008665
算术平方根
2.750298728
7.98686964
增长率区间为(2.75029872,7.986869640)
表7:
A工作环境正常情况下计算表格(拟合均值)
B工作环境正常情况下计算表格(拟合均值)
参数
极小值
极大值
拟合均值
增长率平方
参数1
0
1
0.311500077
1
4.885302687
参数2
0
1
0.311500077
1
4.885302687
参数3
0
66
12.65514006
1
17.76851963
参数4
0
900
282.5963202
1
4.773153733
参数5
0
992
174.8675402
1
21.83567007
参数10
55
101
58.78264503
0.004140883
0.515802915
参数18
0
4
0.695728915
1
22.55647511
参数60
55
70
51.74684219
0.003952233
0.12442519
参数72
0
1
0.311500077
1
4.885302687
参数83
0.76
0.99
0.727574177
0.00198622
0.130094394
求和
7.010079336
82.36004911
算术平方根
2.647655441
9.075243749
增长率区间为(2.64765,9.07524374)
表8:
B工作环境正常情况下计算表格(拟合均值)
AB工作环境正常情况下增长率拟合区间
区间
A区间
B区间
拟合区间
上限
2.647655441
2.750298728
2.698592153
下限
9.075243749
7.98686964
8.535138306
表9:
AB工作环境正常情况下增长率拟合区间
由此得到拟合区间(2.698592153,8.535138306)进行D、E环境的判断。
D工作环境的计算表格
参数
D均值
拟合均值
增长率平方
参数1
0.59
0.308499923
0.799344231
参数2
1
0.308499923
4.885302687
参数3
29.35
12.55485994
1.740330166
参数4
573.8
279.8436798
1.061843988
参数5
134.65
173.2924598
0.052894755
参数10
58.44
58.48735497
3.40E-05
参数18
0.771
0.689271085
0.01170513
参数60
28.24
51.56315781
0.206357795
参数72
1
0.308499923
4.885302687
参数83
0.5571
0.725525823
0.054898775
求和
13.69801419
算术平方根
3.70108284
注:
此值在拟合区间判断为正常工作
表10:
D工作环境的计算表格
E工作环境的计算表格
参数
D均值
拟合均值
增长率平方
参数1
0.48
0.308499923
0.292605915
参数2
0.48
0.308499923
0.292605915
参数3
27.63
12.