1、Y,X为提供的X和Y数组,alpha为显著性水平(缺省时设定为0.05),b,bint为回归系数估计值和它们的置信区间,r,rint为残差(向量)及其置信区间,stats是用于检验回归模型的统计量,有四个数值,第一个是R2,第二个是F,第三个是与F对应的概率 p ,p 拒绝 H0,回归模型成立,第四个是残差的方差 s2 。残差及其置信区间可以用 rcoplot(r,rint)画图。例1合金的强度y与其中的碳含量x有比较密切的关系,今从生产中收集了一批数据如下表 1。先画出散点图如下: x=0.1:0.01:0.18;y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0
2、,50.0;plot(x,y,+) 可知 y 与 x 大致上为线性关系。设回归模型为 y =0 +1x用regress 和rcoplot 编程如下:clc,clear x1=0.1:0.18;y=42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0x=ones(9,1),x1;b,bint,r,rint,stats=regress(y,x);b,bint,stats,rcoplot(r,rint) 得到 b =27.4722 137.5000 bint =18.6851 36.2594 75.7755 199.2245 stats =0.7985 27.7469
3、 0.0012 4.0883 即 0=27.4722 1=137.5000 0的置信区间是18.6851,36.2594, 1 的置信区 间是75.7755,199.2245;R2= 0.7985 , F = 27.7469 , p = 0.0012 , s2 =4.0883 。可知模型(41)成立。观察命令 rcoplot(r,rint)所画的残差分布,除第 8 个数据外其余残差的置信区间均包含零点第8个点应视为异常点,将其剔除后重新计算,可得 b =30.7820 109.3985 bint =26.2805 35.2834 76.9014 141.8955 stats =0.9188 67.8534 0.0002 0.8797 应该用修改后的这个结果。