基线二级度量指标工况总异常度表设计16.docx
《基线二级度量指标工况总异常度表设计16.docx》由会员分享,可在线阅读,更多相关《基线二级度量指标工况总异常度表设计16.docx(14页珍藏版)》请在冰豆网上搜索。
基线二级度量指标工况总异常度表设计16
基线与二级度量指标
通过基础度量指标来抽象表达每一次开机的运行状况,也就是说该基础度量指标也就是本次开机特征值。
以基础度量指标为数据分析基础。
得到每个工况的每个基础度量指标的平均值基线,标准差基线。
然后以这两类基线为参考线,计算得到每个基础度量指标的异常度,也就是二级度量指标。
然后对这些异常度进行统计分析。
(为方便后续计算表达,记n为所有该类型所有设备拥有的切片总数,记第i个切片的平均值为average_(i),标准差为standard_(i),方差为variance_(i),总回传计数量为countOfSent_(i),不同取值计数量为countOfDistinctParavalue_(i),回传频率计算量为sentFrequence_(i),最大值为max_(i),最小值为min_(i),0回传计数表为countOf0_(i),1回传计数表为countOf1_(i))
第一章基线
每个工况的每个度量指标的基线为后续的异常度的度量提供了依据。
该基线如同人的体温一样,是一个大群体的平均水平。
工况度量指标的基线
平均值基线
对于每个工况的每个度量指标在所有切片中平均值,得到的就是该工况的该度量指标的平均值基线
标准差基线
对于每个工况的每个度量指标在所有切片中标准差,得到的就是该工况的该度量指标的标准差
1公共度量指标对应的基线
所有基线都在存储在一个表中,表设计为:
CF名为:
baseline_bc_46m_all
所有列名均为基础度量指标CF名+下划线+standard/average
KEY:
工况号
ColumnName:
max_average
ColumnName:
max_standard
ColumnName:
min_average
ColumnName:
min_standard
ColumnName:
average_average
ColumnName:
average_standard
ColumnName:
min_average
ColumnValue:
最大值的平均值基线
ColumnValue:
最大值的标准差基线
ColumnValue:
ColumnValue:
ColumnValue:
ColumnValue:
ColumnValue:
1.1平均值(average)的基线
平均值的平均值基线:
平均值的标准差基线:
1.2标准差(standard)的基线
标准差的平均值基线:
标准差的标准差基线:
1.3方差(Variance)的基线
方差的平均值基线:
方差的标准差基线:
1.4总回传量计数(countOfSent)的基线
总回传量的平均值基线:
总回传量的标准差基线:
1.5不同取值计数(countOfDistinctParavalue)的基线
不同取值计数的平均值基线:
不同取值计数的标准差基线:
1.6回传频率(sentFrequence)的基线
回传频率的平均值基线:
回传频率的标准差基线:
2模拟量指标表:
2.1最大值(Max)的基线
最大值的平均值基线:
最大值的标准差基线:
2.2最小值(Variance)的基线
最小值的平均值基线:
最小值的标准差基线:
3开关量指标表
3.10回传计数(sentOf0)的基线
0回传计数的平均值基线:
0回传计数的标准差基线:
3.21回传计数(sentOf1)的基线
1回传计数的平均值基线:
1回传计数的标准差基线:
4状态量指标表
4.1状态切换次数(countOfChange)的基线
状态切换次数的平均值基线:
状态切换次数的标准差基线:
第二章二级度量指标表
二级度量指标为各个一级度量指标对应的无量纲的量,该量反应各一级度量指标在群体中的离群程度。
度量思路为该指标值偏离该指标的平均值有几个标准差。
为使用方便,对于每一个公共度量指标的表,还有一个伴随“转置”的表。
“转置”的含义是将基础表中的车号和工况号索引顺序调换。
5公共度量指标表
5.1平均值离群度(average_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.2平均值离群度转置表(gk_average_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.3标准差离群度(standard_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.4标准差离群度转置表(gk_standard_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.5方差离群度(variance_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.6方差离群度转置表(gk_variance_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.7总回传量计数离群度(count_of_sent_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.8总回传量计数离群度转置表(gk_count_of_sent_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.9不同取值计数离群度(count_of_sent_distinct_paravalue_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.10不同取值计数离群度转置表(gk_count_of_sent_distinct_paravalue_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.11回传频率离群度(sent_frequence_outlier_degree)
以推测开工时间记,计算方法:
CountOfSent/该切片的时间长度
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
5.12回传频率离群度转置表(gk_sent_frequence_outlier)
以推测开工时间记,计算方法:
CountOfSent/该切片的时间长度
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
6模拟量指标表:
6.1最大值离群度(max_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
6.2最大值离群度转置表(gk_max_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
6.3最小值离群度(variance_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
6.4最小值离群度转置表(gk_variance_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
7开关量指标表
7.10回传计数离群度(count_of_zero_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
7.20回传计数离群度转置表(gk_count_of_zero_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
7.31回传计数离群度(count_of_one_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
7.41回传计数离群度转置表(gk_count_of_one_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
8状态量指标表
8.1状态切换次数离群度(count_of_change_outlier_degree)
KEY:
车号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnName:
工况号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
8.2状态切换次数离群转置表(gk_count_of_change_outlier)
KEY:
工况号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnName:
车号_切片号
ColumnValue:
ColumnValue:
ColumnValue:
第三章工况异常度统计
工况异常度统计表是描述所有群体的各个工况的基本属性。
通过该属性可以知道哪些工况可能是值得用户关注的工况
9工况总异常度(para_outlier_degree_bc_46m_all,现有表名para_outlier)
key为异常度类型,分别是:
平均值离群度、标准差离群度、方差离群度、总回传量计数离群度、不同取值计数离群度、回传频率离群度、最大值离群度、最小值离群度、0回传计数离群度、1回传计数离群度、状态切换次数离群度。
对于每一列,为各个分位点的值,分别是5%分位点、25%分位点、50%分位点、75分位点、95分位点。
例如:
对于平均值异常度average_outlier,工况号为bc129的“工况号_5”的值为:
所有切片的bc129工况平均值异常度的5%分位点。
KEY:
ColumnName:
工况号_5
ColumnName:
工况号_25
ColumnName:
工况号_50
ColumnName:
工况号_75
ColumnName:
工况号_95
ColumnName:
工况号_5
average
ColumnValue:
ColumnValue:
ColumnValue:
ColumnValue:
ColumnValue:
ColumnValue:
standard
variance
count_of_sent
sent_frequence