Matlab回归分析.docx
《Matlab回归分析.docx》由会员分享,可在线阅读,更多相关《Matlab回归分析.docx(15页珍藏版)》请在冰豆网上搜索。
Matlab回归分析
1、考察温度x对产量y的影响,测得下列10组数据:
温度(℃)
20
25
30
35
40
45
50
55
60
65
产量(kg)
13.2
15.1
16.4
17.1
17.9
18.7
19.6
21.2
22.5
24.3
求y关于x的线性回归方程,检验回归效果是否显著,并预测x=42℃时产量的估值及预测区间(置信度95%).
x=[20:
5:
65]';
Y=[13.215.116.417.117.918.719.621.222.524.3]';
X=[ones(10,1)x];
plot(x,Y,'r*');
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats;
rcoplot(r,rint)%残差分析,作残差图
结果:
b=
9.1212
0.2230
bint=
8.021110.2214
0.19850.2476
stats=
0.9821439.83110.00000.2333
即
;
的置信区间为
的置信区间为
;
=0.9821,F=439.831,p=0.0000,p<0.05,可知回归模型y=9.1212+0.2230x成立.
将x=42带入得到18.4872.
从残差图可以看出,所有数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型y=9.1212+0.2230x能较好的符合原始数据。
2
某零件上有一段曲线,为了在程序控制机床上加工这一零件,需要求这段曲线的解析表达式,在曲线横坐标xi处测得纵坐标yi共11对数据如下:
求这段曲线的纵坐标y关于横坐标x的二次多项式回归方程。
t=0:
2:
20;
s=[0.62.04.47.511.817.123.331.239.649.761.7];
T=[ones(11,1),t',(t.^2)'];
[b,bint,r,rint,stats]=regress(s',T);
b,stats;
Y=polyconf(p,t,S)
plot(t,s,'k+',t,Y,'r')%预测及作图
b=
1.0105
0.1971
0.1403
stats=
1.0e+04*
0.00011.37730.00000.0000
图形为:
3
混凝土的抗压强度随养护时间的延长而增加,现将一批混凝土作成12个试块,记录了养护日期x(日)及抗压强度y(kg/cm2)的数据:
养护时间x
2
3
4
5
7
9
12
14
17
21
28
56
抗压强度y
35
42
47
53
59
65
68
73
74
82
84
99
试求
型回归方程。
%建立volum.m文件
functionyhat=volum(beta,x);
yhat=beta
(1)+beta
(2)*log(x);
%输入
x=[234579121417212856];
y=[354247535965687376828699];
beta0=[51]';
[beta,r,J]=nlinfit(x',y','volum',beta0);
beta
结果:
beta=
21.0058
19.5285
所得回归模型为:
画线:
plot(x,y,'r-')
x=[234579121417212856]';
u=log(x);
u=[ones(12,1)u];
y=[354247535965687376828699]';
[b,bint,r,rint,stats]=regress(y,u);
b,bint,stats
结果为:
b=
21.0058
19.5285
bint=
19.446322.5653
18.894320.1627
stats=
1.0e+03*
0.00104.70690.00000.0009
做残差图:
rcoplot(r,rint)
预测及作图:
z=b
(1)+b
(2)*log(x);
plot(x,y,'k+',x,z,'r')
1.设有五个样品,每个只测量了一个指标,分别是1,2,6,8,11,试用最短距离法将它们分类。
(样品间采用绝对值距离。
)
clc
clear
b=[1;2;6;8;11];
d=pdist(b,'cityblock');
D=squareform(d);
z=linkage(d);
H=dendrogram(z);
T=cluster(z,2);
结果:
各样品之间的绝对距离为:
距离矩阵
样品间的最短距离为:
;
2.表1是1999年中国省、自治区的城市规模结构特征的一些数据,试通过聚类分析将这些省、自治区进行分类。
(表1见下页)
省、自治区
城市规模(万人)
城市首位度
城市指数
基尼系数
城市规模中位值(万人)
京津冀
699.7
1.4371
0.9364
0.7804
10.88
山西
179.46
1.8982
1.0006
0.587
11.78
内蒙古
111.13
1.418
0.6772
0.5158
17.775
辽宁
389.6
1.9182
0.8541
0.5762
26.32
吉林
211.34
1.788
1.0798
0.4569
19.705
黑龙江
259
2.3059
0.3417
0.5076
23.48
苏沪
923.19
3.735
2.0572
0.6208
22.16
浙江
139.29
1.8712
0.8858
0.4536
12.67
安徽
102.78
1.2333
0.5326
0.3798
27.375
福建
108.5
1.7291
0.9325
0.4687
11.12
江西
129.2
3.2454
1.1935
0.4519
17.08
山东
173.35
1.0018
0.4296
0.4503
21.215
河南
151.54
1.4927
0.6775
0.4738
13.94
湖北
434.46
7.1328
2.4413
0.5282
19.19
湖南
139.29
2.3501
0.836
0.489
14.25
广东
336.54
3.5407
1.3863
0.402
22.195
广西
96.12
1.2288
0.6382
0.5
14.34
海南
45.43
2.1915
0.8648
0.4136
8.73
川渝
365.01
1.6801
1.1486
0.572
18.615
云南
146
6.6333
2.3785
0.5359
12.25
贵州
136.22
2.8279
1.2918
0.5984
10.47
西藏
11.79
4.1514
1.1798
0.6118
7.315
陕西
244.04
5.1194
1.9682
0.6287
17.8
甘肃
145.49
4.7515
1.9366
0.5806
11.65
青海
61.36
8.2695
0.8598
0.8098
7.42
宁夏
47.6
1.5078
0.9587
0.4843
9.73
新疆
128.67
3.8535
1.6216
0.4901
14.47
a=[699.70001.43710.93640.780410.8800
179.46001.89821.00060.587011.7800
111.13001.41800.67720.515817.7750
389.60001.91820.85410.576226.3200
211.34001.78801.07980.456919.7050
2592.30590.34170.507623.4800
923.19003.73502.05720.620822.1600
139.29001.87120.88580.453612.6700
102.78001.23330.53260.379827.3750
108.50001.72910.93250.468711.1200
129.20003.24541.19350.451917.0800
173.35001.00180.42960.450321.2150
151.54001.49270.67750.473813.9400
434.46007.13282.44130.528219.1900
139.29002.35010.83600.489014.2500
336.54003.54071.38630.402022.1950
96.12001.22880.63820.500014.3400
45.43002.19150.86480.41368.7300
365.01001.68011.14860.572018.6150
1466.63332.37850.535912.2500
136.22002.82791.29180.598410.4700
11.79004.15141.17980.61187.3150
244.04005.11941.96820.628717.8000
145.49004.75151.93660.580611.6500
61.36008.26950.85980.80987.4200
47.60001.50780.95870.48439.7300
128.67003.85351.62160.490114.4700
];
d1=pdist(a);%欧氏距离:
d1=pdist(a);,%b中每行之间距离
z1=linkage(d1)%作谱系聚类图:
H=dendrogram(z1)
T=cluster(z1,3)%%输出分类结果
结果为:
(1)z1=
8.000015.00001.6521
20.000024.00002.0877
18.000026.00002.4880
11.000027.00002.7654
21.000028.00003.9199
29.000032.00006.9926
3.000010.00007.1673
13.000033.00007.3528
31.000035.00008.6125
2.000012.000011.2916
9.000034.000012.7262
17.000038.000012.8051
25.000030.000015.5084
6.000023.000016.3291
36.000039.000018.0388
37.000042.000022.9979
4.000019.000025.7717
16.000044.000028.7559
5.000043.000032.8508
41.000046.000032.9368
22.000040.000033.7288
47.000048.000036.1367
14.000045.000045.7490
49.000050.000077.5676
1.00007.0000223.7891
51.000052.0000265.4356
(2)输出分类结果:
T=
1
3
3
3
3
3
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
3
表明,若分三类,3是一类,2是一类,其它的是一类。
(3)做谱系聚类图: