Minitab实战.docx
《Minitab实战.docx》由会员分享,可在线阅读,更多相关《Minitab实战.docx(63页珍藏版)》请在冰豆网上搜索。
Minitab实战
Minitab实战
有些时刻我们在复制数据进入minitab后,因为分析的须要,须要对数据的分列进行处理,我们会有专门多偷懒
的方法,先看看下图的敕令菜单。
●它们分别为堆叠栏、堆叠栏块、堆叠行。
针对下图的数据
我们在选择上面的堆叠栏时,显现如图的对话框,并如图输入指令时,
堆叠行的对话框操作全然与堆叠栏雷同,输出的不合能够依照附图看出。
堆叠的操作在专门多的分析中能够应用,如方差分析、测量体系分析、操纵图等等。
●转换栏操作1
有些时刻我们的数据须要从栏的次序构造转换为行的构造,这时能够应用转换栏操作,如图。
●转换栏操作2
应用转换栏的操作,针对下图1的数据,进行图2的对话框操作后的成果如图1。
==将A、B栏的数据转换为行的格局。
转换栏前后数据
●按序分列数据
有时为了分析和不雅察的便利,须要将数据按某栏的数据大年夜小进行分列,这是能够应用sort敕令,对话框如图。
针对图1的数据按图2对话框操作今后的数据分列后果如图1。
●栏运算1
在进行minitab分析时,有时须要对数据进行简单的运算或函数运算,完成那个功能的菜单操作如图1,显现的对话框及扼要的操作方法如图2。
sample
针对图中的C1栏进行简单运算和对数运算的成果如图。
●行、栏统计1
我们有时须要对某一栏或行的数据进行一些全然统计,履行如图菜单可帮帮你。
在履行菜单后显现的对话框如图,此敕令一次只供给一个全然统计参数的运算,包含:
均指、和、方差、极值、缺掉数据等,然后输入须要运算的栏或行地点栏组就能够了。
●标准化操作
标准化结合与分布概念应当不是一个生疏的名词,minitab的操作菜单如图。
从显现的对话框来看,minitab供给5种标准化的方法:
1.减去均值并除以标准差;
2.减去均值;
3.除以标准差;
4.减去指定的值并除以指定的值;
5.将数据标准化,使得数据变更在某个范畴内。
什么是标准化结合?
是标准化操作,例如将均值为μ,标准差为σ的正态分布转化为标准正态分布,其操作确实是(x-μ)/σ,那个应用是专门重要的。
各类常见的标准化操作上面讲的5种,但应用第一种居多。
●生成模板数据
有时我们在进行输入数据的时刻,有些数据是显现某种规律的,但一个个输入就显得比较苦恼,我们能够尝尝生成模板数据那个操作,菜单操作如图。
生成模板数据共有5种:
1.等距数据的生成
2.自定义数列数据的生成
3.自定义文本数据的生成
4.等距日期数据的生成
5.自定义日期数据的生成
等距数据的操作如图1,例如生成简单的1到3的数据,间距为1,每个数据反复2次,总体反复两次,按图1操作后,输出成果如图2。
生成自定义数列数据的对话框如图,例如生成数列为1、3、9的数据,每个数据反复2次,总体反复两次,按图1操作后,输出成果如图2。
关于其它几种模板数据的生成方法,操作全然与上面讲述的对话框操作及生成成果类似,例如自定义文本数据的生成,确实是在Textvalues(e.g.,red"lightblue")框中输入要生成的文本数列就能够了,如a、b、c。
●生成随机数据
进行随机抽样或生成各类分布的随机数据,能够进行一些验证分析和抽样分析,其菜单操作如图。
选择上面菜单的SampleFromColumns,显现进行随机抽样的对话框及操作如图1。
例如我们要从总体为1-10的数据中随机抽取5个样本,则在Sample___rowsfromcolumn(s)中输入5,并给出总体数据1-10地点栏,选择储备地位,选择是否反复抽样等后,输出成果如图2。
假如抽取的样本量大年夜于总体数据量,就必须选择Samplewithreplacement,也确实是许可反复抽样,例如从1-10中抽取12个数据,输出如图2。
生成随机数菜单的后续选项重要确实是生成屈从各类分布的随机数据,其输入的内容主假如:
1.生成分布数据的样本量为若干
2.储备数据的栏
3.确信分布的参数值给定,如正态分布的均值和标准差,卡方分布的自由度,F分布的分子和分母自由度。
以下是生成卡方分布的示例:
1.样本量为10
2.生成10组,分别储备于C1-C10
3.自由度给定为5
对话框的输入和数据输出成果如图。
其它的分布数据生成类似。
●专门多时刻我们因为没有现成的分布概率表,因此无从查起,minitab中供给了那个功能,如附图所示菜单操作,它供给了多种分布的概率密度函数值、累积概率密度及分位数值得运算。
在显现的对话框中,要求选择的也是这三个值,任君选择,三个值得图形含义见附图2。
示例
需求标准正态分布的均值地位的累积概率。
对话框输入如图,成果如下:
CumulativeDistributionFunction
Normalwithmean=0andstandarddeviation=1
x P( X <= x
0 0.5
示例2
需运算标准正态分布的0.9分位数,操作如图,输出成果如下:
InverseCumulativeDistributionFunction
Normalwithmean=0andstandarddeviation=1
P( X <= x
x
0.9 1.28155
●全然描述性统计1
我们在获得简单的样本数据之后,欲望对其进行一些全然的描述性统计分析,从分析中对总体做出一些估量,比如参数的程度、离散程度、分布形状等等,对我们做进一步的分析有专门大年夜的感化。
描述性统计包含3个菜单项,如图,其成果差不多相等,最后者默认多了几个图形、置信区间及正态的考查。
我们将displayDescriptiveStatistics和stroeDescriptiveStatistics一并讲述,其菜单操作完全一致,只是后者在woksheet窗口储备分析成果。
以以下数据进行描述性统计分析示例,菜单操作如图,在Variables中输入数据,在Byvariables输入分组的指标栏(假如存在分组的情形)。
机台 数据
1 105
1 106
1 109
1 103
1 108
2 92
2 97
2 90
2 99
2 95
默认的分析参数成果如下
DescriptiveStatistics:
数据
Variable 机台 N N* Mean SEMean StDev Minimum Q1 Median Q3
数据 1 5 0 106.20 1.07 2.39 103.00 104.00 106.00 108.50
2 5 0 94.60 1.63 3.65 90.00 91.00 95.00 98.00
Variable 机台 Maximum
数据 1 109.00
2 99.00
个中的输出包含均值、均值标准差、样本标准差、极值、一三分位数
在描述统计的主队框内还有两个复选的对话框,statistics和graphs,前者对分析成果的中的统计参数进行设置,后者能够生成响应的图形。
graphicalsummary
图形概要分析,将部分图形和数据分析成果整合为一张图形,菜单操作为Stat>BasicStatistics>GraphicalSummary,其对华框输入专门简单,如图1,例如对以下数据的分析,分析成果如图2。
date
20.6760
20.4807
20.2388
19.5027
19.2971
22.3003
17.7818
19.9037
20.3809
20.0546
20.0162
20.7074
21.3276
20.5386
19.6196
18.9708
19.9232
20.3483
20.6612
20.6077
18.0273
19.9562
19.5547
20.6370
21.6431
20.2904
20.7241
19.2214
19.9852
19.0299
1-SampleZ
Stat>BasicStatistics>1-SampleZ
单样本Z考查,假设考查的一种,考查样本的均值程度,总体的标准差已知(一样来源于靠得住有效的汗青数据成果或某些专门场合)的情形。
例如针对以下数据,考查原假设为样本均值等于34,考查的对话框操作如图。
date
30.1085
30.1348
29.1167
31.3980
30.3632
30.1460
31.3888
30.4308
30.6547
31.0456
30.4946
29.5554
31.4230
31.9619
30.5474
29.2900
29.7606
30.5125
31.1061
29.6948
29.5461
29.8016
28.8727
30.4455
29.8649
30.5563
30.0517
28.6718
30.3047
31.4132
minitab输出成果为,P值近似为0,说明拒绝原假设,均值不等于34。
One-SampleZ:
date
Testofmu=34vsnot=34
Theassumedstandarddeviation=1
Variable N Mean StDev SEMean 95%CI Z P
date 30 30.2887 0.8032 0.1826 (29.9309,30.6466) -20.33 0.000
点击1-samplettest对话框的options,弹出对话框如图,个中能够自行输入置信度水平和选择假设考查的备择假设情势。
1-samplettest
单样本t考查与单样本Z考查因此在操作上比较雷同,但其应用是不合的,单样本t考查重要针对总体标准差未知的情形。
针对上例的数据,采取1-sample t考查,操作如图,成果如下:
One-SampleT:
date
Testofmu=34vsnot=34
Variable N Mean StDev SEMean 95%CI T P
date 30 20.0802 0.9415 0.1719 (19.7286,20.4318) -80.98 0.000
(options复选对话框的操作意义雷同)
2-samplettest
Stat>BasicStatistics>2-Samplet
双样本t考查,比较两个程度是否有明显差别或者两个程度的大年夜小比较问题。
在进行考查时,起首确信命据的正态性和方差其性,因为双样本t考查是在总体呈正态分布的差不多长进行的,同时方差不合考查的方法也不合。
假设对以下数据的考查,先验证正态性及方差齐性,然落后行双样本t考查,菜单操作如图。
输出成果如下,我们从p值能够得出结论,两个工厂间存在明显的差别。
Two-SampleT-TestandCI:
甲工厂,乙工厂
Two-sampleTfor甲工厂vs乙工厂
N Mean StDev SEMean
甲工厂 10 50.25 1.18 0.37
乙工厂 10 55.175 0.662 0.21
Difference=mu(甲工厂)-mu(乙工厂)
Estimatefordifference:
-4.92678
95%CIfordifference:
(-5.82624,-4.02731)
T-Testofdifference=0(vsnot=):
T-Value=-11.51 P-Value=0.000 DF=18
BothusePooledStDev=0.9573
甲工厂 乙工厂
49.2619 54.4834
51.1988 55.9786
51.1832 56.1006
50.0621 54.6117
51.1369 55.1237
50.7307 55.1400
49.2937 54.6925
51.7491 54.3854
47.9031 56.0615
49.9637 55.1736
对话框的补偿
1.供给3种数据输入情势
〉数据在一栏,程度标记在一栏,选择Samplesinonecolumn,在Samples中输入数据地点栏,在Subscripts输入程度标记。
〉两个程度的数据分别在两栏,选择Samplesindifferentcolumns,在First和second平分别输入两个程度数据地点的栏。
〉已知两个程度的样本量、均值和标准差而没有具体的样本数据,则选择Summarizeddata,在Samplesize、Mean、Standarddeviation平分别输入两个程度的样本量、均值和标准差。
2.Assumeequalvariances选项,假如两个程度方差相等,则点选此项,不然不选,minitab将履行不合的分析方法。
3.graphs复选对话框,选择将显现如图1的对话框,能够选择生成置信区间图或箱线图。
4.options复选对话框,选择将显现如图2的对话框,能够确信分析的置信度程度,以及考查时的程度间的差值和备选假设的模式。
留意这是的备择假设模式假如是大年夜于或小因此,minitab默认将第一个样本放在前面,第二个样本放在后面。
Pairedt
在介绍成对t考查前,先将以下成对t考查的概念
************
我们在进行2samplet考查时,差别仅由身分程度不合引起,但有时刻却并不是如许,那确实是除了身分程度不合引起的差别外(我们要考查的),那确实是每次实验还受别的一个变量的阻碍,也确实是说,那个变量对每次实验的两个程度的阻碍雷同,但对多次实验之间的阻碍就有差别,这时刻就不克不及简单的将两个程度的样本进行比较,而是对两个程度的差值进行比较,如许就将别的的变量的阻碍排出了,运算的成果也就靠得住,就看起来操纵图内组内和组间的概念,身分程度的阻碍就反应在组内(若干个同一次实验)了。
举个通俗的例子,我们要比较两种鞋底的耐磨程度,因此选择20小我进行实验,每小我两只脚分别穿一种鞋底作的鞋,在那个地点,我们能够看到,除了两种鞋底的不合引起的耐磨后果不合外,20小我体重的不合也是一个阻碍,这是要零丁的考量鞋底不合的阻碍,就要清除体重那个变量,如何办呢,成对T考查,确实是如许一个概念,将每小我的磨损情形做差值进行分析。
************
菜单操作Stat>BasicStatistics>Pairedt
如图
只要明白得了pairett与2samplet的差别,其对话框的操作类似,数据分别储备在两个栏内,在对话框直截了当选择进入first和second复选框内就能够。
graph、option操作意义雷同。
1.若何进行等方差考查
后续会讲到及minitab操作
2.方差等和不等是2samplet考查有何不合
请看附图,主假如统计参数和自由度的运算不合。
1Proportion
单比例P考查
菜单操作:
Stat>BasicStatistics>1Proportion
主对话框如图1
数据输入两种
Samplesincolumns:
将检查成果数据直截了当输入
Summarizeddata:
输入检查总数在Numberoftrials,输入合格总数在Numberofevents。
options对话框如图2
Confidencelevel:
置信度程度
Testproportion:
考查比率
Alternative:
备择假设模式
Usetestandintervalbasedonnormaldistribution:
在正态分布的差不多上考查(一样样本量较大年夜的场合)
2Proportions
双样本P考查,菜单操作如图
显现的对话框操作如图。
举例
对下例数据进行考查,是否存在明显差别。
因为检查数据分别在两栏,我们选择Samplesindifferentcolumns输入数据。
sample1 sample2
0 1
1 0
0 0
0 0
0 0
1 0
0 0
0 0
0 0
0 1
考查成果如下
TestandCIforTwoProportions:
sample1,sample2
Event=1
Variable X N Samplep
sample1 2 10 0.200000
sample2 2 10 0.200000
Difference=p(sample1)-p(sample2)
Estimatefordifference:
0
95%CIfordifference:
(-0.350609,0.350609)
Testfordifference=0(vsnot=0):
Z=0.00 P-Value=1.000
*NOTE*Thenormalapproximationmaybeinaccurateforsmallsamples.→样本量太少,成果弗成靠
Fisher'sexacttest:
P-Value=1.000
简单的从P值来看,认为两者没有明显差别。
点击主对话框的options,将显现如图的对话框,其内容如图1。
个中是否选择useapooledestimateofpforthetest,运算方法不合,其差别如图2
2Variances
双样本方差齐性考查
重要比较两个样本的方差考查,菜单操作如图。
考查模型为
H0:
σ1=σ1
H1:
σ1≠σ1
双样本方差考查的对话框如图1。
Samplesinonecolumn:
数据储备在一栏内,那么数据输入Samples框中,数据标记输入Subscripts中。
Samplesindifferentcolumns:
两个样本的数据分别在两栏内,则分别将两栏数据的栏号输入First、Second。
Summarizeddata:
将两个样本数据的样本量和方差分别输入Samplesize、Variance。
*option对话框能够设置置信度程度,Storage对话框能够选择储备两个样本的标准差、方差或置信高低限。
示例
S1 S2
30.2441 29.3238
31.0379 30.0866
27.9622 30.3843
29.9718 31.4472
31.1175 31.1020
29.7028 30.6207
29.2911 28.9792
29.5267 29.3002
30.5728 30.4844
32.2077 30.6304
30.4481 31.0498
29.3376 29.1559
31.5307 29.1551
29.4860 30.3291
30.1718 30.4949
30.1388 30.2574
29.4959 30.9022
31.5960 27.9214
29.9977 30.2293
29.9297 30.7134
分析成果如图2
包含正态分布差不多上的考查成果(F-Test),和其它任何连续数据分布的考查成果(Levene'sTest)。
从P值来看,考查成果都无差别。
NormalityTest
正态性考查
经由过程抽样样本考查总体是否为正态分布。
minitab供给了3种考查方法,分别为Anderson-Darling(美国)、Ryan-Joiner(中国)、Kolmogorov-Smirnov(俄罗斯)可供选择。
别的能够在正态概率图上画出参考线,能够在Percentilelines中输入特定的值即可实现。
菜单操作Stat>BasicStatistics>NormalityTest
假设对下列数据进行考查。
同时想估量不良率的程度,规格为(12,24),应用Anderson-Darling方法考查成果如图。
能够从P值看出总体屈从正态分布,合格率为0.9477-0.0026=0.9451。
date
18.9000
18.4540
18.4418
20.9672
15.9194
14.9419
20.9746
20.1208
21.4498
21.4262
22.3970
14.9576
17.8887
19.7197
22.0388
19.7466
13.6395
18.7285
20.9326
17.7009
22.8862
20.7942
18.1364
18.7222
21.9095
21.9868
25.1861
17.8491
23.8443
17.0503
Regression
实际生活中的专门多现象之间存在着互相依附、互相制约的关系,这