ImageVerifierCode 换一换
格式:DOCX , 页数:36 ,大小:868.96KB ,
资源ID:12064664      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12064664.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(MINITAB统计基础.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

MINITAB统计基础.docx

1、MINITAB统计基础MINITAB统计基础1.正态总体的抽样分布1) 样本均值,的分布标准正态分布及 T分布样本标准差计算公式:T分布的定义:Student t distribution,如果X服从标准正态分布, S2服从个自由度的卡方分布,且它们相互独立,那么随机量所服从的分布称为 个自由度的t分布。其分布密度函数为:当一:时的极限分布即是标准正态分布,当 二-时就是Cauchy分布。t分布只包含1个参数。数学期望和方差分别为 o, 一匸a -】时期望不存在,-方差不存在)。我们常常用 冗门 表示U个自由度的t分布。MINITAB对于更一般的t分布还增加了一个“非中心参数”,当非中心参数为

2、0时,就得到了我们现在所说的 t分布。在用MINITAB计算时,只要注意这一点就行了。自由度:可以简单理解为在研究问题中,可以自由独立取值的数据或变量的个数。范例:ZN(0 , 1),求Z=1.98时的概率密度。计算-概率分布-正态分布- 概率密度- 输入常数1.98-确定概率密度函数正态分布,均值 =0 和标准差=1x f( x )1.98 0.0561831 - o计算-概率分布-正态分布-累积概率-输入常数2.4-确定累积分布函数正态分布,均值 =0 和标准差=1x P( X = x )2.4 0.991802ZN(0,1),求使得 P(Zx)=0.95 成立的x值,即Z的0.95分位数

3、。计算-概率分布-正态分布-逆累积概率-输入常数0.95-确定逆累积分布函数正态分布,均值 =0 和标准差=1P( X = x ) x0.95 1.64485自由度=12,求使得戸溟 二二:.ko确定计算-概率分布-t分布-逆累积概率-输入自由度12-输入常数0.95逆累积分布函数学生t分布,12自由度P( X = x ) x0.95 1.7822自由度=12,求使得j唯-o计算-概率分布-t分布-累积概率-输入自由度12-输入常数3-确定累积分布函数学生t分布,12自由度x P( X = x )3 0.9944672) 双样本均值差的分布3) 正态样本正态样本方差 S2的分布 卡房卡方分布若

4、X1, X2, ;Xn是从正态总体9 . 中抽出的一组样本量为 n的独立随机样本,记_ 1V1=1!口 已知时:当 未知时,用.替i丄后可以得到a2-Xa(n-D其概率密度函数在正半轴上呈正偏态分布。卡方分布的定义:把 n个相互独立的标准正态随机变量的平方和称为自由度为 n的卡方分布。它的密度表达式为:参数称为自由度。卡方分布有向右的偏斜, 特别在较小自由度情况下 (-越小,分布越偏斜)。我们常用 芒顒0表达自由度为仪的卡方分布。卡方分布有很多用途,其中一项就是用来分析单个正态总体样本方差的状况;还可以用来进行分布的拟合 优度检验,即检验资料是否符合某种特定分布;对于离散数据构成的列联表,也可

5、以用来分析两个离散型 因子间是否独立等。卡方分布的性质a) 卡方分布的加法性:设 X和Y彼此独立,且都服从卡方分布,其自由度分别为 n1, n2。若令Z=X+Y则Z服从自由度为n1+n2的卡方分布。b) 若,则純订-i,阳Q -计算下列各卡方分布的相关数值:自由度=10,求使得 廉严必盘:叮泻 成立的x值。计算- 概率分布- 卡方分布- 逆累积概率 - 自由度=10 -常数=0.95 -确定逆累积分布函数 卡方分布,10自由度P( X = x ) x0.95 18.307计算- 概率分布卡方分布累积概率- 自由度=10 -常数=28 -确定累积分布函数 卡方分布,10自由度x P( X 概率分

6、布 F分布 逆累积概率 分子自由度=8 分母自由度=18常数=0.95 -确定逆累积分布函数F分布,8分子自由度和18分母自由度P( X = x ) x0.95 2.510162.参数的点估计1)点估计的概念用单个数值对于总体参数给出估计的方法称为点估计。设?是总体的一个未知参数, 人,X2,Xn是从总体中抽取的样本量为 n的一个随机样本,那么用来估计未知参数?的统计量: (X1, X2, %)称为?的估计量,或称为 ?的点估计。我们总是在参数上方画一个帽子“ 表示该参数的估计量。在工程中经常出现的点估计问题之最好结果对于总体方差对于总体均值是:对于比率P ,匸, x是样本量为n的随机样本中我

7、们感兴趣的那类出现的次数;对于-1 - -2,. 一厂(两个独立随机样本均值之差) ; 对于P1 - P2,估计为两个独立随机样本比率之差);2)点估计的评选标准3.参数的区间估计设?是总体的一个待估参数, 从总体中获得样本量为 n的样本是X1, X2,,Xn ,对给定的显著性水平a ( 0a 1),有统计量:?L= ?L (X1, X2,,Xn)与?U= ?U (X1, X2,,Xn),若对于任意?有 P ( ?L ? 基本统计量- 单样本Z来实现的。由于实际情况中,已知标准差的情况很少见,因此我们这里重点关注的是标准差位置时的情况。b)当总体方差未知时,二用样本标准差S代替,此时正态总体均

8、值 I1的1 - a置信区间为:式中,I ;;- 1 ;表示自由度为n -1的t分布的 分位数,也就是t分布的双侧 a分位数。1 3例如a =0.05时,样本量n = 16时,I二 二:,其值略大于财在MINITAB中,我们通过: 统计- 基本统计量- 单样本t来实现的。某集团公司正推进节省运输费用活动,下表为 20个月使用的运输费用调查结果数据:17421827168117421676168017921735168718521861177817471678175417991697166418041707假设运输费用是服从正态分布的,求运输费用均值的 95%置信区间。统计- 基本统计量- 单样

9、本t -样本所在列=运输费用- 选项- 置信水平= 95 确定。单样本T:运输费用 均值标变量 N 均值标准差 准误 95% 置信区间运输费用 20 1745.2 61.9 13.8 (1716.2, 1774.2)c) 前两种情况讨论的是当总体为正态分布时, 的区间估计,然而当总体不是正态分布时, 如果样本量n超过30,则可根据中心极限定理知道: 二仍近似服从正态分布,因而仍可用正态分布总提示的均值的区间估计方法,而且可以直接用样本标准差代替总体标准差,即采用公式:在MINITAB中,通常直接采用: 统计- 基本统计量- 图形化汇总 中得到总体均值的置信区 间结果。只不过要注意的是:总体非正

10、态时,在小样本情况下此结果并不可信,只有当样本量超过 30后,由于中心极限定理的保证,此结果才是可信的。2)单正态总体方差和标准差的置信区间当 时,正态总体方差的置信区间是:(n - 1)S5 (n-l)S2=5 Xa a(p- 1)(n-l)Ss1,2(n-l)当 紆认O (巧:时,正态总体标准差的置信区间是:某集团公司正推进节省运输费用活动,下表为 20个月使用的运输费用调查结果数据:17421827168117421676168017921735168718521861177817471678175417991697166418041707假设运输费用是服从正态分布的,求运输费用方差和标

11、准差的 95%置信区间。统计- 基本统计量- 单方差- 样本所在列 =运输费用- 选项 - 置信水平=95 确定。单方差检验和置信区间:运输费用 方法卡方方法仅适用于正态分布。Bon ett方法适用于任何连续分布。 统计量变量 N标准差方差运输费用 20 61.9 383095%置信区间标准差置信方差置信区变量 方法区间间运输费用 卡方(47.1,90.4) (2215, 8170)Bonett (49.0, 86.6) (2401,7507)求总体标准差置信区间另一种方法:统计 -基本统计量-图形化汇总-变量:运输费用-置信水平:95 -确定圏笳叱;匚总9Sft 何A平方F蓝Q#: 7: 电

12、星1745. 2C1. 93829. 7-0,9&92-316610宾一 ISijM1盘乙:=世監17C, 5垃三口三亡骯179*. 3LctJ.C境臺蛊它国闾Id1774 216t?.4rm T47. L90. i运输费用汇总L7f 17 ZO 1H0 17-60 17S0 15003) 单总体比率的置信区间当塔十二“歸时,也就是X取“非0则1 ”的0-1分布,我们常需要估计总体中感觉的那类比率的置信区间,比如,一批产品中,不合格品率的大致范围;顾客满意度调查中,有抱怨顾客的比率范围等。这里我们记总体比率为 p,样本比率为 p。可以证明,当样本量足够大时(要求 np5及np( 1-p)5),

13、且p值适中(0.1p基本统计量-单比率-汇总数据:事件数=1230,实验数=2000-选项-置信水平:95 ;勾选使用正态分布的检验和区间 - 确定由于np5及np (1-p) 5,可用于正态分布近似二项分布,故可以勾选使用基于正态分布的检验和区 间。单比率检验和置信区间样本 X N 样本p 95% 置信区间1 1230 2000 0.615000 (0.593674, 0.636326)使用正态近似。4) 双总体均值差的置信区间设有两个总体二 ”竝珂,从总体X中抽取的样本Xi, X2,Xn,样本均值为.,样本方差为了 ,样本标准差为 S;,;,从总体Y中抽取的样本丫1, 丫2,,Yn,样本均

14、值为,样本方差为馬产岀,样本标准差为:賞对两总体均值差异 的区间估计常有以下三种情况:a) 两个总体均服从正态分布,且两个总体的方差 -都已知时,两总体均值差异 一-:的1-只要样本量足够大,无论两总体的方差是否相等,上式都成立。b) 两个总体均服从正态分布,且两个总体的方差 他异 均未知时,两总体均值差异 一-:的1-1 1 1n TnQi Y) t a (n + m 2Sp1-TT置信水平下的置信区间为:-4-, 0C-Y) + t t(n4m-2)Sp - + - n in 4- 尸n 严式中,一家冶金公司需要减少其排放到废水中的生物氧需求量含量。用于废水处理的活化泥供应商建议,用纯氧取

15、代空气吹入活化泥以改善生物氧需求量含量(此数值越小越好) 。从两种处理的废水中分别抽取10个和9个样品,数据如下:空气184194158218186218165172191179氧气163185178183171140155179175已知生物氧需求量含量服从正态分布,试确定:该公司采用空气和采用纯氧减少生物氧需求量含量均 值之差的95%置信区间。(n J 十(m n + m - 2求两总体-一:的置信区间:统计-基本统计量-双样本t-样本在不同列中:第一 =空气,第二=氧气-勾选假定等方差-选项:置信水平=95,备择=不等于-确定。双样本T检验和置信区间:空气,氧气空气与氧气的双样本T均值标

16、 N 均值标准差 准误空气 10 186.5 20.0 6.3氧气 9 169.9 14.7 4.9差值=mu (空气)-mu ( 氧气)差值估计值:16.61差值的95% 置信区间:(-0.58, 33.80)差值=0 (与工)的T 检验:T 值=2.04 P 值=0.057 自由度=17两者都使用合并标准差 =17.7356c)当两个总体均服从正态分布,且两个总体的方差 码吩啪均未知时,两总体均值差异 一- -:的1-a置信水平下的置信区间为:式中,自由度u的计算公式为:假定A, B两名工人生产相同规格的轴棒,关键尺寸是轴棒的直径。由于 A使用的是老式车床,B使用的是新式车床,二者精度可能

17、有差异。 经检验,他们的直径数据确实来自两个方差不等的正态分布。 现他们各测定13根轴棒直径,数据如下:12345678910111213A14.7614.2114.0215.0810.6512.1816.6718.2012.2411.2116.6713.4516.85B12.3710.2813.1813.2613.8010.9610.5712.8311.6713.5412.4213.2412.52试确定A, B生产的轴棒直径差异的 95%置信区间。求两总体心 7的置信区间:统计-基本统计量-双样本t-样本在不同列中:第一 =空气,第二=氧气-选项:置信水平=95,备择=不等于-确定。双样本T

18、检验和置信区间:A工人,B工人 A工人与B工人的双样本T均值标N 均值标准差 准误A 工人 13 14.32 2.35 0.65B 工人 13 12.36 1.15 0.32差值=mu (A 工人)-mu (B 工人)差值估计值:1.965差值的95% 置信区间:(0.435, 3.496)差值=0 (与 工)的T 检验:T 值=2.71 P 值=0.015 自由度=17独立随机样本取自均值 一_一未知,标准差未知的两个正态分布总体,若第一个总体样本标准差S1=0.73,样本量n=25,,第二个总体样本标准差 S2=0.89,样本量n=20,- -。求一-:的95%置信区间。统计-基本统计量-

19、双样本t-汇总数据:第一(样本数量 =25,均差=6.9,标准差=0.73),第二(样本数量=20,均差=6.7,标准差=0.89) -选项:置信水平 =95 -确定。双样本T检验和置信区间均值标 样本N 均值标准差 准误1 25 6.900 0.730 0.152 20 6.700 0.890 0.20差值=mu-mu (2)差值估计值:0.200差值的95% 置信区间:(-0.301, 0.701)差值=0 (与 工)的T 检验:T 值=0.81 P 值=0.423 自由度=365) 双总体比率差的置信区间设两个总体的比率分别为 P1和p2,为了估计p1 - p2,分别从两个总体中各随机抽

20、取样本量为 n1和n2的两(Pi - Pa)-2个随机样本,并计算两个样本的比率 _ T ,可以证明p1 - p2的置信水平为1 -a的置信区间为:为了解员工对工资的满意度,对 250名男员工、200名女员工进行调查,数据如下:区分样本数满意男250110女200104合计450214求男女员工对工资满意度差异的 95%置信区间。统计-基本统计量-双比率-汇总数据:第一(事件 =110,实验=250),第二(事件=104,实 验=200)-选项:置信水平=95 -勾选使用P的合并估计值进行检验 -确定。双比率检验和置信区间 样本 X N 样本p1 110 250 0.4400002 104 200 0.520000差值=p-p差值估计值:-0.08差值的 95% 置信区间:(-0.172630, 0.0126298)差值=0(与 丰0)的检验:Z = -1.69 P 值=0.091Fisher 精确检验:P 值=0.106

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1