1、MINITAB统计基础MINITAB统计基础1.正态总体的抽样分布1)样本均值 X 的分布标准正态分布及T分布样本标准差计算公式:T分布的定义:Student t distribution,如果X服从标准正态分布,S2服从个自由度的卡方分布,且它们相互独立,那么随机量所服从的分布称为 个自由度的t分布。其分布密度函数为:当 时的极限分布即是标准正态分布,当 =1 时就是Cauchy分布。T分布只包含1个参数。数学期望和方差分别为0,-2(1时期望不存在,2方差不存在)。我们常常用 t 表示 个自由度的t分布。MINITAB对于更一般的t分布还增加了一个“非中心参数”,当非中心参数为0时,就得到
2、了我们现在所说的t分布。在用MINITAB计算时,只要注意这一点就行了。自由度:可以简单理解为在研究问题中,可以自由独立取值的数据或变量的个数。范例:ZN(0,1),求Z=1.98时的概率密度。计算-概率分布-正态分布-概率密度-输入常数1.98-确定概率密度函数 正态分布,均值 = 0 和标准差 = 1 x f( x )1.980.0561831ZN0,1,求PZ概率分布-正态分布-累积概率-输入常数2.4-确定累积分布函数 正态分布,均值 = 0 和标准差 = 1 x P( X = x )2.4 0.991802ZN(0,1),求使得P(Z概率分布-正态分布-逆累积概率-输入常数0.95-
3、确定逆累积分布函数 正态分布,均值 = 0 和标准差 = 1P( X = x ) x 0.95 1.64485自由度=12,求使得PZ概率分布-t分布-逆累积概率-输入自由度12-输入常数0.95-确定逆累积分布函数 学生 t 分布,12 自由度P( X 概率分布-t分布-累积概率-输入自由度12-输入常数3-确定累积分布函数 学生 t 分布,12 自由度x P( X = x )3 0.9944672)双样本均值差的分布3)正态样本正态样本方差S2的分布卡房卡方分布若X1,X2,,Xn是从正态总体N,2中抽出的一组样本量为n的独立随机样本,记则当 已知时:当未知时,用 X 替 后可以得到其概率
4、密度函数在正半轴上呈正偏态分布。卡方分布的定义:把n个相互独立的标准正态随机变量的平方和称为自由度为n的卡方分布。它的密度表达式为:参数 1 称为自由度。卡方分布有向右的偏斜,特别在较小自由度情况下( 越小,分布越偏斜)。我们常用 2 表达自由度为 的卡方分布。卡方分布有很多用途,其中一项就是用来分析单个正态总体样本方差的状况;还可以用来进行分布的拟合优度检验,即检验资料是否符合某种特定分布;对于离散数据构成的列联表,也可以用来分析两个离散型因子间是否独立等。卡方分布的性质a)卡方分布的加法性:设X和Y彼此独立,且都服从卡方分布,其自由度分别为n1,n2。若令Z=X+Y,则Z服从自由度为n1+
5、n2的卡方分布。b)若 X2n ,则 EX=n ,VX=2n 。计算下列各卡方分布的相关数值:自由度=10,求使得 P2 概率分布 - 卡方分布 - 逆累积概率 - 自由度=10 - 常数=0.95 - 确定逆累积分布函数 卡方分布,10 自由度P( X 概率分布 - 卡方分布 - 累积概率 - 自由度=10 - 常数=28 - 确定累积分布函数 卡方分布,10 自由度 x P( X 概率分布 - F分布 - 逆累积概率 - 分子自由度=8 - 分母自由度=18 -常数=0.95 -确定逆累积分布函数 F 分布,8 分子自由度和 18 分母自由度P( X 基本统计量 - 单样本Z 来实现的。由
6、于实际情况中,已知标准差的情况很少见,因此我们这里重点关注的是标准差位置时的情况。b)当总体方差 2 未知时, 用样本标准差S代替,此时正态总体均值 的 1 置信区间为:式中,t1-2n-1 表示自由度为n 1的 t 分布的 1-2 分位数,也就是t分布的双侧 分位数。例如=0.05时,样本量n = 16时,t0.97515=2.131,其值略大于Z0.975=1.96。在MINITAB中,我们通过:统计 - 基本统计量 - 单样本t 来实现的。某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:1742182716811742167616801792173516871
7、8521861177817471678175417991697166418041707假设运输费用是服从正态分布的,求运输费用均值的95%置信区间。统计 - 基本统计量 - 单样本t - 样本所在列 = 运输费用 - 选项 - 置信水平 = 95 - 确定。单样本 T: 运输费用 均值标变量 N 均值 标准差 准误 95% 置信区间运输费用 20 1745.2 61.9 13.8 (1716.2, 1774.2)c)前两种情况讨论的是当总体为正态分布时, 的区间估计,然而当总体不是正态分布时,如果样本量n 超过30,则可根据中心极限定理知道:X 仍近似服从正态分布,因而仍可用正态分布总提示的均
8、值 的区间估计方法,而且可以直接用样本标准差代替总体标准差,即采用公式:在MINITAB中,通常直接采用:统计 - 基本统计量 - 图形化汇总 中得到总体均值的置信区间结果。只不过要注意的是:总体非正态时,在小样本情况下此结果并不可信,只有当样本量超过30后,由于中心极限定理的保证,此结果才是可信的。2)单正态总体方差和标准差的置信区间当 X N(,2)时,正态总体方差的置信区间是:式中,1-22n-1和22n-1分别是 1-2 分位数与 2 分位数。当 X N(,2)时,正态总体标准差的置信区间是:某集团公司正推进节省运输费用活动,下表为20个月使用的运输费用调查结果数据:17421827168117421676168017921735168718521861177817471678175417991697166418041707假设运输费用是服从正态分布的,求运输费用方差和标准差的95%置信区间。统计 - 基本统计量 - 单方差 - 样本所在列 = 运输费用 - 选项 - 置信水平 = 95 - 确定。单方差检验和置信区间: 运输费用 方法卡方方法仅适用于正态分布。Bonett 方法适用于任何连续分布。统计量变量 N 标准差 方差运输费用 20 61.9 383095
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1