ImageVerifierCode 换一换
格式:DOCX , 页数:13 ,大小:213.66KB ,
资源ID:8248906      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/8248906.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(实验三 数据的简单统计分析与推断.docx)为本站会员(b****6)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

实验三 数据的简单统计分析与推断.docx

1、实验三 数据的简单统计分析与推断实验三 数据的简单统计分析与推断一、 实验目的: 对采集数据利用数理统计的知识,辅以matlab进行估计、分析和推断,即从一定总体中随机抽出一部分样本简单估计、分析和推断,以此对所研究的总体进行推测性的判断。1. 掌握参数估计和假设检验的基本理论模型与分类;2. 了解方差分析和线性回归模型的matlab解决方案;3. 根据问题的要求建立模型;4. 针对已经建立的模型,确定参数,通过Matlab求解;二、 预备知识:1. 参数估计:利用样本统计量对总体(服从正态分布)参数进行估计:点估计、区间估计;2. 假设检验:总体均值的假设检验、总体方差的假设检验和两总体的检

2、验;3. 方差分析:背景:事件的发生往往与多个因素有关,但各个因素对事件发生的影响可能是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。通过方差分析,可以研究不同因素以及因素的不同水平对事件发生的影响程度。根据自变量个数的不同,方差分析可以分为单因子方差分析和多因子方差分析。数学原理: 一个实验有多个影响因素,如果只有一个在发生变化,则称为单因子分析。假设某一实验有个不同条件,则在每个条件(或称水平)下进行实验,可以得到个总体,分别记为,个总体的平均数表示为,各总体的方差表示为。现在,在这个总体服从正态分布且方差相等的情况下检查各总体的平均数是否相等,若相等则认为因素对实验结果之间

3、没有显著影响。双因子方差分析,因素水平的改变所造成的实验结果的改变,称为主效应。当某一因素的效应随另一因素的水平不同而不同,则称这两个因素之间存在交互作用。由于交互作用引起的实验结果的改变称为交互效应。4. 线性回归:背景:实际生活中,某个现象的发生或某种结果的出现往往与其他的某个或某些因素有关,但这种关系又是不确定的,只是从数据上可以看出有关的趋势。回归分析就是用来研究具有这种特征的变量之间的相关关系的。线性回归假设因变量与自变量之间为线性关系,用一定的线性回归模型来拟合变量,确定模型中的未知参数。 5. 参数估计、假设检验、方差分析和回归分析的matlab实现;6. 用matlab进行基本

4、统计分析: 1 基本统计量:均值:mean(x):平均值或数学期望;中位数:median(x):将数据由小到大排序后中间位置的数据;标准差:std(x):各个数据与均值偏离程度的度量;方差:var(x):标准差的平方;偏度:skewness(x):反映分布的对称性,大于零:此时数据位于均值右边的比位于左边的多;等于零,对称分布;小于零,偏向均值的左侧。峰度:kurtosis(x):用于衡量偏离正态分布尺度的统计量之一。 正态分布的峰度为3,若2 比3 大得多, 表示分布有沉重的尾巴,说明样本中含有较 多远离均值的数据,因而峰度可以用作衡量 偏离正态分布的尺度之一。参数估计:1、正态总体的参数估

5、计设总体服从正态分布,则其点估计和区间估计可以同时以下命令获得:muhat,sigmahat,muci,sigmaci = normfit(DATA,alpha)参数说明:DATA为样本、alpha为显著性水平(缺省时默认为0.05)muhat:均值 的点估计;sigmahat:标准差的点估计muci:针对于均值的置信水平为1-alpha的区间估计;sigmaci:针对于标准差的置信水平为1-alpha的区间估计; 2、其他分布的参数估计 若无法保证总体服从正态分布,有两种处理方法:一是取容量充分大的样本(n50),按中心极限定理,它近似的服从正态分布,仍可以用上面的估计公式计算;二是使用ma

6、tlab工具箱中具有特定总体分布的估计命令,常见命令:muhat,muci = expfit(DATA,alpha):,在显著性水平alpha下,求指数分布的数据DATA的均值的点估计和取间估计 lambdahat,lambdaci = poissfit(DATA,alpha): 在显著性水平alpha下,求指数分布的数据DATA的参数的均值的点估计和取间估计 phat,pci = mle(data,distribution,value,alpha,value):通用参数估计命令,在显著性水平alpha下,求distr分布的数据DATA的参数估计。 示例: phat,pci = mle(dat

7、a,distribution,binomial,alpha,.05,)phat = 0.7370pci = 0.7171 0.7562 假设检验: 在总体服从正态分布的情况下,可以用以下命令进行检验。1) 、总体方差已知,总体均值的检验(z-检验)h,sig,ci = ztest(x,m,sigma,alpha,tail)检验数据x的关于均值的某一假设是否成立,其中sigma为已知方差,alpha为显著性水平tail = 0;tail = 1;tail = -1 ;h=0:接受假设;h=1:拒绝假设( h:bull);sig:假设成立的概率;ci:均值的1-alpha置信区间;2) 、总体方差

8、未知,总体均值的假设检验(t-检验)h,p,ci= ttest(x,m,alpha,tail)检验数据x的关于均值的某一假设是否成立,其它参数说明同上述z-检验的参数说明相一致。3) 、两总体均值的假设检验(t-检验)h,p,ci= ttest2(x,y,alpha,tail)检验数据x,y的关于均值的某一假设是否成立,其它参数说明同上述z-检验的参数说明相一致。 4)、非参数检验,总体分布的检验1h=normplot(x)此命令显示数据矩阵的正态概率图。如果数据来自于正态分布,则图形显示出直线性形态,而其他概率分布函数显示出曲线形态。 方差分析: 1)、用anoval函数进行单因子方差分析:

9、 p=anova1(X) 比较样本的矩阵X中多列数据的均值,返回所有样本取自同一群体的零假设成立的概率。该命令将生成两个图形,第一个为标准方差分析表,第二个显示X每一列的箱型图,箱型图中心线上较大的差异对应较大的F值和较小的p值。一般当p值小于0.05时认为结果是显著的。 方差分析一般用的显著性水平是:取,拒绝,称因素 A的影响(或 A各水平的差异)非常显著;取,不拒绝,但取,拒绝,称因素 A的影响显著;取,不拒绝,称因素 A无显著影响。 2)、用anova2函数进行双因子方差分析: P=anova2(X,reps)进行平衡双因子方差分析,以比较样本X中两列或两列以上和两行或两行以上数据的均值

10、。不同列中的数据代表一个因子A的变化,不同行中的数据代表因子B的变化。其中reps代表每一个单元格中观测值的个数,当reps=1返回两个p值,当reps1时返回3个p值。 线性回归:1)、用regress进行线性回归 b,bint,r,rint=regress(y,X,alpha)2)、用rcoplot会残差图 Reoplot(r,rint) 示例:1、综合示例:一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下: 4

11、59 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 2

12、46 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851试观察该刀具出现故障时完成的零件数属于哪种分布.%数据录入x1=459 362 624 542 509 584 433 748 815 505;x2=612 452 434 982 640 742 565 706 593 680;x3=926 653 164 487 734 608 428 1153 593 844;x4=527 552 513 781 474 388 824 538 862 659;

13、x5=775 859 755 49 697 515 628 954 771 609;x6=402 960 885 610 292 837 473 677 358 638;x7=699 634 555 570 84 416 606 1062 484 120;x8=447 654 564 339 280 246 687 539 790 581;x9=621 724 531 512 577 496 468 499 544 645;x10=764 558 378 765 666 763 217 715 310 851; x=x1 x2 x3 x4 x5 x6 x7 x8 x9 x10;%绘制频率直方图

14、figure(1)hist(x,10)%分布的正态性检验 figure(2) normplot(x)%参数估计muhat,sugmuhat,muci,sigmuci=normfit(x,0.05)%假设检验h,sig,ci=ttest(x,594)运行结果:muhat = 594sugmuhat = 204.1301muci = 553.4962 634.5038sigmuci = 179.2276 237.1329h = 0sig = 1ci = 553.4962 634.5038 2、一位教师想要检查3种不同教学方法的效果,为此随机的选取了水平相等的15位学生。把他们分为3组,每组5人,每

15、一组用一种教学方法,一段时间以后,这位教师给这15位学生进行统考,统考成绩如下表。要求检验这3种教学方法的效果有没有显著差异。 方法成绩甲7562715873乙8185689290丙7379607581score=75 81 73;62 85 79;71 68 60;58 92 75;73 90 81;p=anova1(score)p = 0.0401 3、设火箭的射程在其他条件基本相同时与燃料种类和推进器型号有关。现在考虑四中不同的燃料及3种不同的推进器,对于每种搭配各发射了火箭两次,测得数据如表,要求检验各自变量和自变量的交互效应是否对火箭的射程有显著影响。 推进器1推进器2推进器3燃料1

16、582562653526412608燃料2491541516428505484燃料3601709392583732407燃料4758582487715510414disp2=58.2 52.6 49.1 42.8 60.1 58.3 75.8 71.5; 56.2 41.2 54.1 50.5 70.9 73.2 58.2 51; 65.3 60.8 51.6 48.4 39.2 40.7 48.7 41.4;p=anova2(disp2,2)p = 0.0035 0.0260 0.0001 4、 X = ones(10,1) (1:10);y = X * 10;1 + normrnd(0,0

17、.1,10,1);b,bint,r,rint = regress(y,X,0.05)rcoplot(r,rint)b = 10.0337 0.9943bint = 9.8369 10.2304 0.9626 1.0260r = 0.0014 -0.1560 0.0547 0.1513 -0.0745 0.0861 0.1314 -0.1477 -0.1268 0.0801rint = -0.2476 0.2505 -0.3856 0.0737 -0.2207 0.3302 -0.1042 0.4069 -0.3588 0.2097 -0.1957 0.3679 -0.1325 0.3952 -

18、0.3958 0.1003 -0.3697 0.1161 -0.1590 0.3192三、 实验内容与要求:1、从一批火箭推力装置中抽取10个进行试验,测得燃烧时间如下:50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5设燃烧时间服从正态分布,求燃烧时间的均值和方差,其中置信水平为90%。2、某种元件,要求其使用寿命不得低于1000小时,现在随机的从这批元件中抽取25件测得其寿命分别为: 906.7 783.4 962.5 978.8 835.4 1068.9 946.2 982.7 967.5 931.3 102.3 891.2 1168.3

19、936.4 961.4 1056.7 955.9 940.4 866.8 979.4 816.4 1021.4 1112.4 880.8 已知这种元件的寿命服从标准差为100的正态分布,试在的显著性水平下确定这批元件是否合格。 3、某校60名学生的一次考试成绩如下:93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78

20、 77 63 53 55 1) 计算均值、标准差、极差、偏度、峰度,画出直方图;2) 检验分布的正态性;3)若检验符合正态分布,估计正态分布的参数并检验参数。4、某种水泥在凝固时放出热量Y与水泥中四种化学成分占比有关,现测得13组数据。要求建立热量与水泥成分之间的经验回归关系式。 编号X1X2X3X4y172666078.52129155274.331156820104.34113184787.6575263395.961155922109.27371176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.3131068812109.4

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1