麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx

上传人:b****5 文档编号:29968868 上传时间:2023-08-03 格式:DOCX 页数:13 大小:64.89KB
下载 相关 举报
麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx_第1页
第1页 / 共13页
麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx_第2页
第2页 / 共13页
麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx_第3页
第3页 / 共13页
麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx_第4页
第4页 / 共13页
麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx

《麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx》由会员分享,可在线阅读,更多相关《麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx(13页珍藏版)》请在冰豆网上搜索。

麦蚕成长过程的平均温度和孵化天数回归分析 概率论课设.docx

麦蚕成长过程的平均温度和孵化天数回归分析概率论课设

成绩评定表

学生姓名

/////

班级学号

////

专业

信息与计算科学

课程设计题目

麦蚕成长过程的平均温度和孵化天数回归分析

 

 

组长签字:

成绩

 

日期

2014年月日

课程设计(论文)任务书

学院

理学院

专业

信息与计算科学

学生姓名

\///

班级学号

/////

课程名称

概率论与数理统计课程设计

课程设计(论文)题目

麦蚕成长过程的平均温度和孵化天数的回归分析

设计要求(技术参数):

通过该课程设计,使学生进一步理解概率论与数理统计的基本概念、理论和方法;初步掌握Excel统计工作表在随机模拟中是应用,MATLAB统计软件包作常见的统计检验和统计分析;具备初步的运用计算机完成数据处理的技能,使课堂中学习到理论得到应用。

设计任务(至少两个):

1.数据整理:

收集数据,录入数据,画出相应图形(如分布图、直方图、盒状图等)。

掌握用MATLAB或Excel作一个正态总体均值、方差的假设检验或两个正态总体的均值差、方差比的假设检验方法。

2.学习用MATLAB或Excel求一个正态总体的均值、方差的置信区间的方法;求两个正态总体的均值差和方差比的置信区间的方法.

3.常用分布的5种功能:

概率密度函数、分布函数、分位数、随机数的生成、均值和方差的应用。

计划与进度安排:

周四1~2节:

选题,设计解决问题方法

周四3~6节:

调试程序

周四7~8节:

完成论文,答辩

指导教师(签字):

 

2014年7月8日

专业负责人(签字):

 

2014年7月18日

主管院长(签字):

2014年7月19日

摘要

数理统计是具有广泛应用的数学分支,而区间估计和假设检验问题在其中占有很重要的地位。

对于正态总体期望和方差的区间估计和假设检验问题已有完备的结论;对于非正态总体期望和方差的区间估计和假设检验问题,在大样本的情况下,可利用中心极限定理转化为正态总体来解决。

但实际问题中常常碰到非正态总体,而且是小样本的情况,因此对它的区间估计和假设检验是一个值得研究的问题。

本科应尽量利用电子计算机以及有关的软件进行统计计算,这样不仅可以提高计算的精确性,还可以大大节省计算的工作量。

MATLAB是世界著名的数学软件,最新的MATLAB有许多重大的改进,功能更加完善。

本书通过大量精选的实例,讲解MATLAB的符号运算、绘图、高精度计算、程序设计等基本功能,介绍它在高等数学、线性代数、微分方程、概率统计、计算方法、运筹学与数学建模等课程中的应用。

统计分析手段在经济运行,科学研究中被广泛的应用,随着经济日趋发展,一些先进的统计软件的开发使用,回归分析作为一种分析手段的重要性和首选性是显而易见的。

对于生活中的一些实际问题,我们很难用理性的思维去理解和解决它。

本次课程设计便是利用概率论与数理统计的回归分析知识在MATLAB软件上进行编成的。

 

关键字:

MATLAB;线性回归;平均温度;孵化天数

 

目录

1设计目的1

2设计原理1

3设计过程4

4设计总结8

5设计心得9

致谢10

参考文献11

麦蚕成长过程的平均温度和孵化天数回归分析

1设计目的

根据已知数据利用MATLAB软件作出散点图及曲线图

构造曲线函数再通过MATLAB软件将曲线图与散点图相拟合

2设计原理

一元线性回归分析作为一种常见的统计分析手段在经济运行,科学研究中被广泛的应用,随着市场经济日趋成熟,一些先进的统计软件的开发使用,它作为一种分析手段的重要性和首选性是显而易见的。

在实际应用中有些变量之间并非是线性相关的关系,但可以作适当的变换把非线性回归问题化为线性回归问题解决。

在实际问题中,当有时两个变量间的关系不是线性相关的关系,而是某种曲线关系,这时如果仍直接作直线回归,就不能反映出这两个变量之间的内在联系,而必须作非线性回归,即通过变量之间的一组观测数据配一条曲线来描述他们之间的关系。

但是直接求回归曲线是不容易的。

所以可以同过变量代换化为线性回归问题来处理。

通过MATLAB软件画出散点图和曲线图,根据散点图粗略判断一元非线性回归的模型,再跟据一元非线性回归的模型,化为线性回归问题。

1.最小二乘法原理

如果把用回归方程

计算得到的

i值(i=1,2,…n)称为回归值,那么实际测量值yi与回归值

i之间存在着偏差,我们把这种偏差称为残差,记为ei(i=1,2,3,…,n)。

这样,我们就可以用残差平方和来度量测量值与回归直线的接近或偏差程度。

残差平方和定义为:

(2-1-2)

所谓最小二乘法,就是选择a和b使Q(a,b)最小,即用最小二乘法得到的回归直线

是在所有直线中与测量值残差平方和Q最小的一条。

由(2-1-2)式可知Q是关于a,b的二次函数,所以它的最小值总是存在的。

下面讨论的a和b的求法。

2.正规方程组

根据微分中求极值的方法可知,Q(a,b)取得最小值应满足

(2-1-3)

由(2-1-2)式,并考虑上述条件,则

(2-1-4)

(2-1-4)式称为正规方程组。

解这一方程组可得

(2-1-5)

其中

(2-1-6)

 (2-1-7)

式中,Lxy称为xy的协方差之和,Lxx称为x的平方差之和。

如果改写(2-1-1)式,可得

(2-1-8)

(2-1-9)

由此可见,回归直线是通过点

的,即通过由所有实验测量值的平均值组成的点。

从力学观点看,

即是N个散点

的重心位置。

3.一元线性回归原理

如果X和Y都是相关的随机变量,在确定x的条件下,对应的y值并不确定,而是形成一个分布。

当X取确定的值时,Y的数学期望值也就确定了,因此Y的数学期望是x的函数,即

E(Y|X=x)=f(x)(2-1-10)

这里方程f(x)称为Y对X的回归方程。

如果回归方程是线性的,则

E(Y|X=x)=α+βx(2-1-11)

Y=α+βx+ε(2-1-12)

其中ε―随机误差

从样本中我们只能得到关于特征数的估计,并不能精确地求出特征数。

因此只能用f(x)的估计式

来取代(2-1-11)式,用参数a和b分别作为α和β的估计量。

4.相关系数的显著性检验

在上面的分析中,为了求得回归方程,我们曾假定x与y之间存在着线性关系。

在求得回归方程后,我们必须对这一假定进行检验,以确定x与y是否的确存在线性关系。

设(X,Y)为二维随机变量,如果E[X-EX][Y-EY]存在,则称它为X与Y之间的协方差,记为Cov(X,Y)。

Cov(X,Y)=E[X-E(x)][Y-E(y)](2-1-15)

如果D(X)>0,D(Y)>0,则称

(2-1-16)

为X与Y之间的相关系数。

对于一个具有n组观测值的样本,其相关系数γ定义为

(2-1-17)

其中Lyy称为观测值的离差平方和,记为

(2-1-18)

见式(2-1-7)。

相关系数

是绝对值小于1,大于0的无量纲统计量。

接近于1,表明x与y之间线性关系密切。

=1时,表示两个变量间存在确定性的线性函数关系。

=0时,表示两个变量间无线性关系。

这时有两种可能情况,一种是二者没有关系,另一种可能是二者有非线性关系(如图2-1-2(d))。

相关系数的正负号由

决定,即

与b同号。

>0时,y随x的增加而增加,当

<0时,y随的x增加而减少。

相关性检验一般利用相关系数检验表(见附录)进行。

该表中给出的

值为相关系数的起码值。

只有当求出的相关系数大于表上相应的数值时,才能考虑用直线来描述x和y之间的相关关系。

查表时要遇到三个参数:

变量总数、自由度和置信水平。

对于一元回归分析,变量只有两个(x,y)。

自由度等于数据组数与变量个数之差。

置信水平(5%和1%)表示线性相关的程度。

通常当

大于表上

相应的值,但小于表上

相应的值时,称为x与y有显著的线性关系;如果

大于表上

相应的值时,称x与y有十分显著的线性关系;如果

小于表上

相应的值时,称为x与y没有明显的线性关系,即回归方程没有实际意义。

3设计过程

题目:

研究麦蚕的成长过程,测得一组数据如表所示

麦蚕成长过程的平均温度和孵化天数

平均

温度T

11.8

14.7

15.4

16.5

17.1

18.1

19.8

20.3

孵化

天数

30.4

15.0

13.8

12.7

10.7

7.5

6.8

5.7

平均

温度T

21.5

22.1

23.8

24.6

25.7

26.2

27.3

28.1

孵化

天数

4.4

3.2

2.9

2.1

1.8

1.5

1.3

1.0

T为历期内每日平均温度的计算平均值。

试求出散点图及曲线图,构造曲线函数将曲线图与散点图相拟合

解:

设平均温度为x,历期为Y,则有Y=a+bx即Y与x成线性关系。

进入MATLAB系统,利用线性回归的知识进行如下操作:

输入:

x=[11.814.715.416.517.118.119.820.3]';

X=[ones(8,1),x];

Y=[30.415.013.812.710.77.506.805.70]';

[b,bint,r,rint,stats]=regress(Y,X);

b,bint,stats

得到运行结果:

b=

57.1458

-2.6520

bint=

40.673773.6178

-3.6258-1.6781

stats=

0.881044.40250.00068.6209

输入:

x=[11.814.715.416.517.118.119.820.3]';

Y=[30.415.013.812.710.77.506.805.70]';

rcoplot(r,rint)

得到残差图:

从残差图看,能较好的符合原始数据,但有一个数据不符,可视为异常点。

散点图:

输入:

x=[11.814.715.416.517.118.119.820.3]';

Y=[30.415.013.812.710.77.506.805.70]';

scatter(x,Y)

得到散点图:

线性拟合:

输入命令:

z=b

(1)+b

(2)*x

plot(x,Y,'k+',x,z,'r')

得到拟合图:

得各数据点及回归方程的图形如图可以看出,只有第一个数据点离回归直线距离较远,有比较显著的线性关系。

4设计总结

当有时两个变量间的关系不是线性相关的关系,而是某种曲线关系,这时如果仍直接作直线回归,就不能反映出这两个变量之间的内在联系,而必须作非线性回归,即通过变量之间的一组观测数据配一条曲线来描述他们之间的关系。

但是直接求回归曲线是不容易的。

所以可以同过变量代换化为线性回归问题来处理。

对于生活中的一些实际问题,我们很难用理性的思维去理解和解决它。

利用电子计算机以及有关的软件进行统计计算,这样不仅可以提高计算的精确性,还可以大大节省计算的工作量。

5设计心得

概率论与数理统计课程由于在自然科学、社会科学、工农业生产、金融、经济等各方面有着广泛的应用,所以本课程在高等学校中的重要性也就更加突出。

统计分析手段在经济运行,科学研究中被广泛的应用,随着经济日趋发展,一些先进的统计软件的开发使用,回归分析作为一种分析手段的重要性和首选性是显而易见的。

MATLAB是世界著名的数学软件,最新的MATLAB有许多重大的改进,功能更加完善。

本书通过大量精选的实例,讲解MATLAB的符号运算、绘图、高精度计算、程序设计等基本功能,介绍它在高等数学、线性代数、微分方程、概率统计、计算方法、运筹学与数学建模等课程中的应用。

是个功能非常多且实用的软件。

 

致谢

本论文是张玉春老师指导下完成的。

她严肃的科学态度,严谨的治学精神,精益求精的工作作风,深深地感染和激励着我。

在此,我向张老师致以诚挚的谢意和崇高的敬意。

同时我还要感谢我的同学们,在论文设计中,他们给了我很多的建议和帮助。

我还要感谢我的论文中被我引用或参考的文献的作者。

 

参考文献

[1]沈恒范《概率论与数理统计教程(第三版)》北京高等教育出版社1995年05月[2]梁冯珍宋占杰张玉环《应用概率统计》天津天津大学出版社2004年05月

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 哲学历史

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1