北科数理统计与Matlab上机报告4.docx

上传人:b****4 文档编号:3538983 上传时间:2022-11-23 格式:DOCX 页数:27 大小:245.44KB
下载 相关 举报
北科数理统计与Matlab上机报告4.docx_第1页
第1页 / 共27页
北科数理统计与Matlab上机报告4.docx_第2页
第2页 / 共27页
北科数理统计与Matlab上机报告4.docx_第3页
第3页 / 共27页
北科数理统计与Matlab上机报告4.docx_第4页
第4页 / 共27页
北科数理统计与Matlab上机报告4.docx_第5页
第5页 / 共27页
点击查看更多>>
下载资源
资源描述

北科数理统计与Matlab上机报告4.docx

《北科数理统计与Matlab上机报告4.docx》由会员分享,可在线阅读,更多相关《北科数理统计与Matlab上机报告4.docx(27页珍藏版)》请在冰豆网上搜索。

北科数理统计与Matlab上机报告4.docx

北科数理统计与Matlab上机报告4

统计分析软件(matlab)实验报告4

序号

班级

姓名

学号

日期

时间

地点

1

信计1502

吕瑞杰

41521335

2017.7.2

8:

00-11:

45

实验楼102

指导教师:

李娜

实验名称:

一、回归分析

二、统计模拟

三、假设检验

四、方差分析

五、回归分析

实验任务:

【练习5_01】(一元线性回归)

(1)以三口之家为单位,某食品在某年中平均月消费量(kg)与其价格(元/kg)之间的关系。

x=[2,2,2.4,2.7,3,3,3.5,3.6,3.8,4,4.5,5];

y=[3,3.6,2.8,2.8,2.3,2.9,1.9,2.1,1.9,1.3,1.5,1];

求出回归直线,写出方差分析表;画出散点图及回归直线,画出点到回归直线的连线,画出回归直线的预测曲线。

(2)求数学信计10概率统计(Y)与数学分析I(X)的回归方程。

【练习5_02】(一元非线性回归)

电化电刷的接触电压降与电流强度有密切关系.试确定两者之间的关系

x=[2.5,5,7.5,10,12.5,15,17.5,20,22.5];

y=[0.65,1.25,1.7,2.08,2.4,2.54,2.66,2.82,3.0];

【练习5_03】(多元线性回归)

某种水泥在凝固时放出的热量y(卡/克)与水泥中下列四种成分有关:

x1=3(GaO)(Al2O3)

的成份(%);x2=3(GaO)(SlO2)的成份(%);x3=4(GaO)(Al2O3)(Fe2O3)的成份(%);x4=2(GaO)(SiO2)

的成份(%);现记录了13组数据,列在下表中,求y对x1,x2,x3,x4的线性回归方程.

编号

x1

x2

x3

x4

y

1

2

3

4

5

6

7

8

9

10

11

12

13

7

1

11

11

7

11

3

1

2

21

1

11

10

26

29

56

31

52

55

71

31

54

47

40

66

68

6

15

8

8

6

9

17

22

18

4

23

9

8

60

52

20

47

33

22

6

44

22

26

34

12

12

78.5

74.3

104.3

87.6

95.9

109.2

102.7

72.5

93.1

115.9

83.8

113.3

109.4

要求:

写出回归直线方程为;列出方差分析表;对回归系数进行检验。

x=[1,7,26,6,60;1,1,29,15,52;1,11,56,8,20;1,11,31,8,47;

1,7,52,6,33;1,11,55,9,22;1,3,71,17,6;1,1,31,22,44;

1,2,54,18,22;1,21,47,4,26;1,1,40,23,34;1,11,66,9,12;1,10,68,8,12];

x=[x(:

1),x(:

2),x(:

3),x(:

5)];

y=[78.5,74.3,104.3,87.6,95.9,109.2,102.7,72.5,93.1,115.9,83.8,113.3,109.4]';

【练习6_01】(统计模拟)计算在30名学生的一个班中至少有两个人生日相同的概率是多少?

(1)公式计算

(2)模拟计算

(3)计算在30名学生的一个班中至少有三个人生日相同的概率是多少?

【练习6_02】(动画)

(1)将[0,1]进行等分,间隔是个随机数,

(2)在每一个间隔点上产生多组(两组)随机数,作为纵坐标,连成多条(两条)曲线(折线);

(3)按照横坐标从小到大将纵坐标进行累加,得到累加曲线(随机游走曲线)。

实验目的:

学习回归分析的基本原理,可以编程完成一元和多元,线性和非线性回归方程的解决办法并且画图使其效果更加明显。

利用以前的学习方法完成多元统计分析的基本原理和方法,并且学会进行简单的统计模拟和基本随机数曲线画图表示。

运行结果:

【练习5_01】

(1)

回归直线方程:

y=(4.8256)+(-0.7799)x

来源平方和自由度均方和F比显著性

回归R6.040016.040090.2608**

误差0.6692100.06690.000003

总和6.709211临界值=4.9646(0.05),10.0443(0.01)

(2)回归直线方程:

y=(34.3321)+(0.5364)x

来源平方和自由度均方和F比显著性

回归3156.309813156.309842.0053**

误差8866.615211875.1408p=0.00000000

总和12022.9250119临界值=3.9215(0.05),6.8546(0.01)

【练习5_02】

(0)回归直线方程:

y=(0.7481)+(0.1099)x

---------------------------------------------------------

来源平方和自由度均方和F比显著性

回归R4.532014.532084.6981**

误差0.374670.05350.000037

总和4.90668临界值=5.5914(0.05),12.2464(0.01)

---------------------------------------------------------

(1)回归直线方程:

y=(0.3983)*(x)^(0.6776)

---------------------------------------------------------

来源平方和自由度均方和F比显著性

回归R1.900111.9001227.0932**

误差0.058670.00840.000001

总和1.95868临界值=5.5914(0.05),12.2464(0.01)

---------------------------------------------------------

(2)回归直线方程:

1/y=(0.1624)+(3.3762)/x

---------------------------------------------------------

来源平方和自由度均方和F比显著性

回归R1.186511.18651755.4462**

误差0.004770.00070.000000

总和1.19128临界值=5.5914(0.05),12.2464(0.01)

---------------------------------------------------------

(3)回归直线方程:

y=(-0.4177)+(1.0860)*ln(x)

---------------------------------------------------------

来源平方和自由度均方和F比显著性

回归R4.881514.88151363.9021**

误差0.025170.00360.000000

总和4.90668临界值=5.5914(0.05),12.2464(0.01)

---------------------------------------------------------

【练习5_03】

【1】对所有变量进行回归分析:

(1)回归直线方程为:

y=62.4054+1.5511x1+0.5102x2+0.1019x3-0.1441x4

-----------------------------------------------------------------

(2)方差分析表:

-----------------------------------------------------------------

来源平方和自由度均方和F比显著性

-----------------------------------------------------------------

回归R2667.89944666.9749111.4792**

误差47.863685.98300.00000043

-----------------------------------------------------------------

总和2715.763112临界值=3.84(0.05),7.0061(0.01)

-----------------------------------------------------------------

(3)回归系数检验:

-----------------------------------------------------------------

自变量:

x1x2x3x4

-----------------------------------------------------------------

估计值:

1.55110.51020.1019-0.1441

统计量:

2.08270.70490.1350-0.2032

-----------------------------------------------------------------

临界值:

2.3060

【2】去掉x3后:

(1)回归直线方程为:

y=71.6483+1.4519x1+0.4161x2-0.2365x3

-----------------------------------------------------------------

(2)方差分析表:

-----------------------------------------------------------------

来源平方和自由度均方和F比显著性

-----------------------------------------------------------------

回归R2667.79033889.2634166.8317**

误差47.972795.33030.00000005

-----------------------------------------------------------------

总和2715.763112临界值=3.86(0.05),6.9919(0.01)

-----------------------------------------------------------------

(3)回归系数检验:

-----------------------------------------------------------------

自变量:

x1x2x3

-----------------------------------------------------------------

估计值:

1.45190.4161-0.2365

统计量:

12.41002.2418-1.3650

-----------------------------------------------------------------

临界值:

2.2622

-----------------------------------------------------------------

【3】再去掉x4后:

(1)回归直线方程为:

y=52.5773+1.4683x1+0.6623x2

-----------------------------------------------------------------

(2)方差分析表:

-----------------------------------------------------------------

来源平方和自由度均方和F比显著性

-----------------------------------------------------------------

回归R2657.858621328.9293229.5037**

误差57.9045105.79040.00000001

-----------------------------------------------------------------

总和2715.763112临界值=4.10(0.05),7.5594(0.01)

-----------------------------------------------------------------

(3)回归系数检验:

-----------------------------------------------------------------

自变量:

x1x2

-----------------------------------------------------------------

估计值:

1.46830.6623

统计量:

12.104714.4424

-----------------------------------------------------------------

临界值:

2.2281

-----------------------------------------------------------------

【练习6_01】

(1)

(2)

概率的真值为:

p_r=0.706316

实验的次数为:

n=1000

成功的次数为:

k=705

概率的估计值为:

p_e=0.705000

置信区间的半径为:

r=0.028733

置信区间为[a,b]=[0.675660,0.733127]

(3)

概率的真值为:

p_r=0.706316

实验的次数为:

n=10000

成功的次数为:

k=288

概率的估计值为:

p_e=0.028800

置信区间的半径为:

r=0.003329

置信区间为[a,b]=[0.025610,0.032268]

【练习6_02】

分析讨论:

在进行相同生日试验中增加试验的次数,进行多次重复实验可以使实验值更加接近理论值,减小误差和测量的不均匀性。

在通过画图完成动画效果时,可以通过改变变化时间改变图片变化频率

心得体会:

回归分析可以明确的显示出两个对象之间的关系表达式,对于我们研究他们之间的更长时间的关系提供有利的保障。

 

2017年07月02日

设计方案描述:

【练习5_01】

首先求出X和Y各自的自由度,均值,以及Sxx、Syy、Sxy、SSS,然后通过公式处理所得基础数据进而计算出回归系数a和b,以及回归平方和和误差平方和,以及回归平方和和误差平方和的自由度。

这样就可以算出有关X、Y的回归方程。

由F分布的累积概率,求临界值,P{F

将F值与临界值对比即可得出分析结果相应的显著程度。

并通过判断条件,检验回归的显著性。

最后将结果输出。

【练习5_03】

首先画出x、y标识的图形,然后对x、y进行处理分析,然后求出其均值、以及以及Sx、Sy、Sxy、SSS,然后通过公式处理所得基础数据进而计算出回归系数a和b,以及回归平方和和误差平方和,以及回归平方和和误差平方和的自由度。

这样就可以算出有关X、Y的回归方程。

由F分布的累积概率,求临界值,P{F

求出F值以及临界值f1和f2,并通过判断条件,检验回归的显著性。

然后通过Matlab画图将回归曲线进行叠加显示出来。

【练习6_01】

用n表示每班的人数,进行统计模拟计算。

对每次试验进行计数,做n次随机试验,产生a个随机数使用二重循环寻找a个随机数中是否有相同的数字。

重复的数字次数叠加,处以总的随机数个数a,计算频率

【练习6_02】

首先利用Matlab代码产生随机数,以坐标大小将坐标进行累加,并且将累加效果以累加曲线方式表现出来。

利用Matlab代码使得每隔一段时间就将图形显示一次,得到动画效果。

主要程序清单:

【练习5_01】

(1)

clc

clear

x=[2,2,2.4,2.7,3,3,3.5,3.6,3.8,4,4.5,5];

y=[3,3.6,2.8,2.8,2.3,2.9,1.9,2.1,1.9,1.3,1.5,1];

n=length(x);

x1=mean(x);

y1=mean(y);

sxx=0;

fori=1:

n;

sxx=sxx+(x(1,i)-x1)^2;

end

sxx=sxx;

syy=0;

fori=1:

n;

syy=syy+(y(1,i)-y1)^2;

end

syy=syy;

sxy=0;

fori=1:

n;

sxy=sxy+(x(1,i)*y(1,i));

end

sxy=sxy-n*x1*y1;

b=sxy/sxx;

a=y1-b*x1;

sr=b*sxy;

se=syy-sr;

ra=1;

ea=n-ra-1;

srr=sr/ra;

ser=se/ea;

f=sr/se*(n-2);

f1=finv(1-0.05,ra,ea);

f2=finv(1-0.01,ra,ea);

if(f>f2)

str='**';

elseif(f>f1)

str='*';

elseif(f

str='-';

end

f3=1-fcdf(f,ra,ea);

fprintf('回归直线方程:

y=\t(%.4f)+(%.4f)x\n',a,b);

fprintf('来源\t平方和\t自由度\t\t均方和\t\tF比\t\t显著性\n');

fprintf('回归R\t%.4f\t%d\t\t%.4f\t\t%.4f\t%s\n',sr,ra,srr,f,str);

fprintf('误差\t%.4f\t%d\t\t%.4f\t\t%.6f\n',se,ea,ser,f3);

fprintf('总和\t%.4f\t\t%d\t临界值=%.4f(0.05),%.4f(0.01)\n',syy,n-1,f1,f2);

z=1:

0.001:

6;

z1=a+b*z;

z2=a+b*x;

z3=a+b*z+0.7;

z4=a+b*z-0.7;

plot(x,y,'*',z,z1,'r',z,z3,'g',z,z4,'g');

holdon

fori=1:

n;

plot([x(1,i),x(1,i)],[y(1,i),z2(1,i)],'m');

end

(2)

x=[91968481919691936590677382829089658465768366

89977182438588939172858580909391907691838780

97796078929571817789879491829993809989848490

86819793928289976097907791638492988994829287

77858878998398818277929696928881799188788995

85909084827594858780]';

y=[907462777787878960767778827977817586636384

64809970707371879079688977946580729472898284

60888781648391628277726288797082937199778271

83619578868760829063927384856770909984888177

84617385709871876578959286938784799387918781

7760838682898891808877]';

n=length(x);

X=[ones(n,1)x];

alpha=0.05;

[b,bint,r,rint,stats]=regress(y,X,alpha);

ahat=b

(1);

bhat=b

(2);

holdon

title('$$\hat{y}=\hat{34.3321}+\hat{0.5364}{x}$$','interpreter','latex','fontsize',20)

yhat=b

(1)+b

(2).*x;

scatter(x,y,'filled');

plot(x,yhat,'k');

fori=1:

n;

a=[x(i)x(i)];

c=[yhat(i)y(i)];

plot(a,c,'r-');

end

sxx=sum(x.^2)-(sum(x))^2/n;

t=bhat*sqrt(sxx)/sqrt(stats(4));

p=(1-tcdf(abs(t),n-2))*2;

se1=stats(4);

sr=sum((yhat-mean(y)).^2);

st=sum((y-mean(y)).^2);

se=sum((yhat-y).^2);

disp(stats(4));

fori=1:

n;

y1(i)=yhat(i)-(-tinv(0.025,n-2)*sqrt(1+1/n+(x(i)-mean(x)).^2/sxx)*sqrt(se/(n-2)));

y2(i)=yhat(i)+(-tinv(0.025,n-2)*sqrt(1+1/n+(x(i)-mean(x)).^2/sxx)*sqrt(se/(n-2)));

end

yleft=y1';

yright=y2'

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 表格模板 > 合同协议

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1