建模过程代码量大于一千课件.docx
《建模过程代码量大于一千课件.docx》由会员分享,可在线阅读,更多相关《建模过程代码量大于一千课件.docx(8页珍藏版)》请在冰豆网上搜索。
建模过程代码量大于一千课件
中国电信融合计费平台维护研发项目V6.0--版本-建模过程
一、设立目标
选“降低系统测试缺陷密度”为目标
Y:
系统测试缺陷数
X1:
系统投入总人日
X2:
研发总工作量
X3:
代码量
基础数据:
产品名称
版本号
代码量(LOC)
研发工作量(H)
系统投入总人日
系统测试缺陷数
ABP
DIC-BIL-ABP-XZ-V6.1.0.0
1185
144
4.5
4
ABP
DIC-BIL-ABP-AH-V6.0.0.0
2850
120
1
0
ABP
DIC-BIL-ABP-SH-V6.5.2.0
1650
96
5
3
ABP
DIC-BIL-ABP-SH-V6.8.0.0
8100
256
23
84
ABP
DIC-BIL-ABP-AH-V6.8.0.0
7500
202.6
7
40
ABP
DIC-BIL-ABP-AH-V6.1.0.0
2250
128
2.5
46
ABP
DIC-BIL-ABP-AH-V6.2.0.0
1020
80
5
8
ABP
DIC-BIL-ABP-SH-V6.5.1.0
2085
96
4.5
7
ABP
DIC-BIL-ABP-AH-V6.7.0.0
2835
168
9
18
开始建模
一、选取基础数据
先看下X与Y的相关性,图形-散点图-简单
好像相关
2、识别离群点
图形-箱线图-多个简单
无异常点
3、正态性验证
统计-基本统计量-正态性检验
P<0.05系统测试缺陷数不符合正态分布
P<0.05代码量不符合正态分布
P>0.05研发工作量符合正态分布
P<0.05系统投入总人日不符合正态分布
(2)对不符合正态分布的数据进行调整
1、对系统测试缺陷数据取平方根:
P>0.05系统测试缺陷数符合正态分布
2、对系统投入总人日的数据取以10为底的对数
P>0.05系统投入总人日符合正态分布
3、对代码量数据取平方根:
P>0.05代码量符合正态分布
四、相关性检验
统计-基本统计-相关
相关:
系统测试缺陷数,系统投入总人日,研发工作量(H),代码量(LOC)
系统测试缺陷数系统投入总人日研发工作量(H)
系统投入总人日0.682
0.043
研发工作量(H)0.7650.663
0.0160.052
代码量(LOC)0.7190.5140.887
0.0290.1570.001
单元格内容:
Pearson相关系数
P值
结论:
系统测试缺陷数与研发工作量P<0.05,o.4系统测试缺陷数与代码量P<0.05,r>0.7强相关,可建方程;
研发工作量与系统投入总人日P>0.05,不可建方程;
代码量与系统投入总人日P>0.05,不可建方程;
代码量与研发工作量P<0.05,r>0.7强相关,可建方程。
PS:
这是参看PPT的数据进行分析的,下面的值是P,上面的是r
3、建方程
统计-回归-回归
方程一:
回归分析:
系统测试缺陷数与研发工作量(H)
回归方程为
系统测试缺陷数=-1.64+0.0391研发工作量(H)
自变量系数系数标准误TP
常量-1.6421.906-0.860.418
研发工作量(H)0.039130.012453.140.016
S=2.01022R-Sq=58.5%R-Sq(调整)=52.6%-----------拟合优度52.6%,可用
方差分析
来源自由度SSMSFP
回归139.93739.9379.880.016
残差误差728.2874.041
合计868.224
系统测试缺陷数残差图
方程二:
回归分析:
系统测试缺陷数与代码量(LOC)
回归方程为
系统测试缺陷数=-1.40+0.100代码量(LOC)
自变量系数系数标准误TP
常量-1.4052.093-0.670.524
代码量(LOC)0.100060.036582.740.029
S=2.17034R-Sq=51.7%R-Sq(调整)=44.8%
方差分析
来源自由度SSMSFP
回归135.25135.2517.480.029
残差误差732.9734.710
合计868.224
系统测试缺陷数残差图
拟合度44.8%,有点低,但也可用
进行预测:
回归分析:
系统测试缺陷数1与研发工作量(H)
回归方程为
系统测试缺陷数1=-1.64+0.0391研发工作量(H)
自变量系数系数标准误TP
常量-1.6421.906-0.860.418
研发工作量(H)0.039130.012453.140.016
S=2.01022R-Sq=58.5%R-Sq(调整)=52.6%
方差分析
来源自由度SSMSFP
回归139.93739.9379.880.016
残差误差728.2874.041
合计868.224
新观测值的预测值
新观拟合值
测值拟合值标准误95%置信区间95%预测区间
13.0530.731(1.326,4.781)(-2.004,8.111)
新观测值的自变量值
新观研发工作
测值量(H)
1120
系统测试缺陷数1残差图
结果偏差大,不可用
回归分析:
系统测试缺陷数1与代码量(LOC)1
回归方程为
系统测试缺陷数1=-1.40+0.100代码量(LOC)1
自变量系数系数标准误TP
常量-1.4052.093-0.670.524
代码量(LOC)10.100060.036582.740.029
S=2.17034R-Sq=51.7%R-Sq(调整)=44.8%
方差分析
来源自由度SSMSFP
回归135.25135.2517.480.029
残差误差732.9734.710
合计868.224
新观测值的预测值
新观拟合值
测值拟合值标准误95%置信区间95%预测区间
1116.67041.203(19.239,214.100)(19.104,214.236)XX
XX表示在自变量中为极端异常值的点。
新观测值的自变量值
新观代码
测值量(LOC)1
11180
系统测试缺陷数1残差图
结果偏差太大,方程不可用