Minitab实战.docx

资源描述

Minitab实战.docx

《Minitab实战.docx》由会员分享，可在线阅读，更多相关《Minitab实战.docx（63页珍藏版）》请在冰豆网上搜索。

Minitab实战.docx

Minitab实战

有些时刻我们在复制数据进入minitab后，因为分析的须要，须要对数据的分列进行处理，我们会有专门多偷懒

的方法，先看看下图的敕令菜单。

●它们分别为堆叠栏、堆叠栏块、堆叠行。

针对下图的数据

我们在选择上面的堆叠栏时，显现如图的对话框，并如图输入指令时，

堆叠行的对话框操作全然与堆叠栏雷同，输出的不合能够依照附图看出。

堆叠的操作在专门多的分析中能够应用，如方差分析、测量体系分析、操纵图等等。

●转换栏操作1

有些时刻我们的数据须要从栏的次序构造转换为行的构造，这时能够应用转换栏操作，如图。

●转换栏操作2

应用转换栏的操作，针对下图1的数据，进行图2的对话框操作后的成果如图1。

==将A、B栏的数据转换为行的格局。

转换栏前后数据

●按序分列数据

有时为了分析和不雅察的便利，须要将数据按某栏的数据大年夜小进行分列，这是能够应用sort敕令，对话框如图。

针对图1的数据按图2对话框操作今后的数据分列后果如图1。

●栏运算1

在进行minitab分析时，有时须要对数据进行简单的运算或函数运算，完成那个功能的菜单操作如图1，显现的对话框及扼要的操作方法如图2。

sample

针对图中的C1栏进行简单运算和对数运算的成果如图。

●行、栏统计1

我们有时须要对某一栏或行的数据进行一些全然统计，履行如图菜单可帮帮你。

在履行菜单后显现的对话框如图，此敕令一次只供给一个全然统计参数的运算，包含：

均指、和、方差、极值、缺掉数据等，然后输入须要运算的栏或行地点栏组就能够了。

●标准化操作

标准化结合与分布概念应当不是一个生疏的名词，minitab的操作菜单如图。

从显现的对话框来看，minitab供给5种标准化的方法：

1.减去均值并除以标准差；

2.减去均值；

3.除以标准差；

4.减去指定的值并除以指定的值；

5.将数据标准化，使得数据变更在某个范畴内。

什么是标准化结合？

是标准化操作，例如将均值为μ，标准差为σ的正态分布转化为标准正态分布，其操作确实是（x-μ）/σ，那个应用是专门重要的。

各类常见的标准化操作上面讲的5种，但应用第一种居多。

●生成模板数据

有时我们在进行输入数据的时刻，有些数据是显现某种规律的，但一个个输入就显得比较苦恼，我们能够尝尝生成模板数据那个操作，菜单操作如图。

生成模板数据共有5种：

1.等距数据的生成

2.自定义数列数据的生成

3.自定义文本数据的生成

4.等距日期数据的生成

5.自定义日期数据的生成

等距数据的操作如图1，例如生成简单的1到3的数据，间距为1，每个数据反复2次，总体反复两次，按图1操作后，输出成果如图2。

生成自定义数列数据的对话框如图，例如生成数列为1、3、9的数据，每个数据反复2次，总体反复两次，按图1操作后，输出成果如图2。

关于其它几种模板数据的生成方法，操作全然与上面讲述的对话框操作及生成成果类似，例如自定义文本数据的生成，确实是在Textvalues（e.g.,red"lightblue"）框中输入要生成的文本数列就能够了，如a、b、c。

●生成随机数据

进行随机抽样或生成各类分布的随机数据，能够进行一些验证分析和抽样分析，其菜单操作如图。

选择上面菜单的SampleFromColumns，显现进行随机抽样的对话框及操作如图1。

例如我们要从总体为1-10的数据中随机抽取5个样本，则在Sample___rowsfromcolumn（s）中输入5，并给出总体数据1-10地点栏，选择储备地位，选择是否反复抽样等后，输出成果如图2。

假如抽取的样本量大年夜于总体数据量，就必须选择Samplewithreplacement，也确实是许可反复抽样，例如从1-10中抽取12个数据，输出如图2。

生成随机数菜单的后续选项重要确实是生成屈从各类分布的随机数据，其输入的内容主假如：

1.生成分布数据的样本量为若干

2.储备数据的栏

3.确信分布的参数值给定，如正态分布的均值和标准差，卡方分布的自由度，F分布的分子和分母自由度。

以下是生成卡方分布的示例：

1.样本量为10

2.生成10组，分别储备于C1-C10

3.自由度给定为5

对话框的输入和数据输出成果如图。

其它的分布数据生成类似。

●专门多时刻我们因为没有现成的分布概率表，因此无从查起，minitab中供给了那个功能，如附图所示菜单操作，它供给了多种分布的概率密度函数值、累积概率密度及分位数值得运算。

在显现的对话框中，要求选择的也是这三个值，任君选择，三个值得图形含义见附图2。

示例

需求标准正态分布的均值地位的累积概率。

对话框输入如图，成果如下：

CumulativeDistributionFunction

Normalwithmean=0andstandarddeviation=1

x P（ X <= x

0 0.5

示例2

需运算标准正态分布的0.9分位数，操作如图，输出成果如下：

InverseCumulativeDistributionFunction

Normalwithmean=0andstandarddeviation=1

P（ X <= x

0.9 1.28155

●全然描述性统计1

我们在获得简单的样本数据之后，欲望对其进行一些全然的描述性统计分析，从分析中对总体做出一些估量，比如参数的程度、离散程度、分布形状等等，对我们做进一步的分析有专门大年夜的感化。

描述性统计包含3个菜单项，如图，其成果差不多相等，最后者默认多了几个图形、置信区间及正态的考查。

我们将displayDescriptiveStatistics和stroeDescriptiveStatistics一并讲述，其菜单操作完全一致，只是后者在woksheet窗口储备分析成果。

以以下数据进行描述性统计分析示例，菜单操作如图，在Variables中输入数据，在Byvariables输入分组的指标栏（假如存在分组的情形）。

机台数据

1 105

1 106

1 109

1 103

1 108

2 92

2 97

2 90

2 99

2 95

默认的分析参数成果如下

DescriptiveStatistics:

数据

Variable 机台 N N* Mean SEMean StDev Minimum Q1 Median Q3

数据 1 5 0 106.20 1.07 2.39 103.00 104.00 106.00 108.50

2 5 0 94.60 1.63 3.65 90.00 91.00 95.00 98.00

Variable 机台 Maximum

数据 1 109.00

2 99.00

个中的输出包含均值、均值标准差、样本标准差、极值、一三分位数

在描述统计的主队框内还有两个复选的对话框，statistics和graphs，前者对分析成果的中的统计参数进行设置，后者能够生成响应的图形。

graphicalsummary

图形概要分析，将部分图形和数据分析成果整合为一张图形，菜单操作为Stat>BasicStatistics>GraphicalSummary，其对华框输入专门简单，如图1，例如对以下数据的分析，分析成果如图2。

date

20.6760

20.4807

20.2388

19.5027

19.2971

22.3003

17.7818

19.9037

20.3809

20.0546

20.0162

20.7074

21.3276

20.5386

19.6196

18.9708

19.9232

20.3483

20.6612

20.6077

18.0273

19.9562

19.5547

20.6370

21.6431

20.2904

20.7241

19.2214

19.9852

19.0299

1-SampleZ

Stat>BasicStatistics>1-SampleZ

单样本Z考查，假设考查的一种，考查样本的均值程度，总体的标准差已知（一样来源于靠得住有效的汗青数据成果或某些专门场合）的情形。

例如针对以下数据，考查原假设为样本均值等于34，考查的对话框操作如图。

date

30.1085

30.1348

29.1167

31.3980

30.3632

30.1460

31.3888

30.4308

30.6547

31.0456

30.4946

29.5554

31.4230

31.9619

30.5474

29.2900

29.7606

30.5125

31.1061

29.6948

29.5461

29.8016

28.8727

30.4455

29.8649

30.5563

30.0517

28.6718

30.3047

31.4132

minitab输出成果为，P值近似为0，说明拒绝原假设，均值不等于34。

One-SampleZ:

date

Testofmu=34vsnot=34

Theassumedstandarddeviation=1

Variable N Mean StDev SEMean 95%CI Z P

date 30 30.2887 0.8032 0.1826 （29.9309,30.6466） -20.33 0.000

点击1-samplettest对话框的options，弹出对话框如图，个中能够自行输入置信度水平和选择假设考查的备择假设情势。

1-samplettest

单样本t考查与单样本Z考查因此在操作上比较雷同，但其应用是不合的，单样本t考查重要针对总体标准差未知的情形。

针对上例的数据，采取1-sample t考查，操作如图，成果如下：

One-SampleT:

date

Testofmu=34vsnot=34

Variable N Mean StDev SEMean 95%CI T P

date 30 20.0802 0.9415 0.1719 （19.7286,20.4318） -80.98 0.000

（options复选对话框的操作意义雷同）

2-samplettest

Stat>BasicStatistics>2-Samplet

双样本t考查，比较两个程度是否有明显差别或者两个程度的大年夜小比较问题。

在进行考查时，起首确信命据的正态性和方差其性，因为双样本t考查是在总体呈正态分布的差不多长进行的，同时方差不合考查的方法也不合。

假设对以下数据的考查，先验证正态性及方差齐性，然落后行双样本t考查，菜单操作如图。

输出成果如下，我们从p值能够得出结论，两个工厂间存在明显的差别。

Two-SampleT-TestandCI:

甲工厂,乙工厂

Two-sampleTfor甲工厂vs乙工厂

N Mean StDev SEMean

甲工厂 10 50.25 1.18 0.37

乙工厂 10 55.175 0.662 0.21

Difference=mu（甲工厂）-mu（乙工厂）

Estimatefordifference:

-4.92678

95%CIfordifference:

（-5.82624,-4.02731）

T-Testofdifference=0（vsnot=）:

T-Value=-11.51 P-Value=0.000 DF=18

BothusePooledStDev=0.9573

甲工厂乙工厂

49.2619 54.4834

51.1988 55.9786

51.1832 56.1006

50.0621 54.6117

51.1369 55.1237

50.7307 55.1400

49.2937 54.6925

51.7491 54.3854

47.9031 56.0615

49.9637 55.1736

对话框的补偿

1.供给3种数据输入情势

〉数据在一栏，程度标记在一栏，选择Samplesinonecolumn，在Samples中输入数据地点栏，在Subscripts输入程度标记。

〉两个程度的数据分别在两栏，选择Samplesindifferentcolumns，在First和second平分别输入两个程度数据地点的栏。

〉已知两个程度的样本量、均值和标准差而没有具体的样本数据，则选择Summarizeddata，在Samplesize、Mean、Standarddeviation平分别输入两个程度的样本量、均值和标准差。

2.Assumeequalvariances选项，假如两个程度方差相等，则点选此项，不然不选，minitab将履行不合的分析方法。

3.graphs复选对话框，选择将显现如图1的对话框，能够选择生成置信区间图或箱线图。

4.options复选对话框，选择将显现如图2的对话框，能够确信分析的置信度程度，以及考查时的程度间的差值和备选假设的模式。

留意这是的备择假设模式假如是大年夜于或小因此，minitab默认将第一个样本放在前面，第二个样本放在后面。

Pairedt

在介绍成对t考查前，先将以下成对t考查的概念

************

我们在进行2samplet考查时，差别仅由身分程度不合引起，但有时刻却并不是如许，那确实是除了身分程度不合引起的差别外（我们要考查的），那确实是每次实验还受别的一个变量的阻碍，也确实是说，那个变量对每次实验的两个程度的阻碍雷同，但对多次实验之间的阻碍就有差别，这时刻就不克不及简单的将两个程度的样本进行比较，而是对两个程度的差值进行比较，如许就将别的的变量的阻碍排出了，运算的成果也就靠得住，就看起来操纵图内组内和组间的概念，身分程度的阻碍就反应在组内（若干个同一次实验）了。

举个通俗的例子，我们要比较两种鞋底的耐磨程度，因此选择20小我进行实验，每小我两只脚分别穿一种鞋底作的鞋，在那个地点，我们能够看到，除了两种鞋底的不合引起的耐磨后果不合外，20小我体重的不合也是一个阻碍，这是要零丁的考量鞋底不合的阻碍，就要清除体重那个变量，如何办呢，成对T考查，确实是如许一个概念，将每小我的磨损情形做差值进行分析。

************

菜单操作Stat>BasicStatistics>Pairedt

如图

只要明白得了pairett与2samplet的差别，其对话框的操作类似，数据分别储备在两个栏内，在对话框直截了当选择进入first和second复选框内就能够。

graph、option操作意义雷同。

1.若何进行等方差考查

后续会讲到及minitab操作

2.方差等和不等是2samplet考查有何不合

请看附图，主假如统计参数和自由度的运算不合。

1Proportion

单比例P考查

菜单操作：

Stat>BasicStatistics>1Proportion

主对话框如图1

数据输入两种

Samplesincolumns：

将检查成果数据直截了当输入

Summarizeddata：

输入检查总数在Numberoftrials，输入合格总数在Numberofevents。

options对话框如图2

Confidencelevel：

置信度程度

Testproportion：

考查比率

Alternative：

备择假设模式

Usetestandintervalbasedonnormaldistribution：

在正态分布的差不多上考查（一样样本量较大年夜的场合）

2Proportions

双样本P考查，菜单操作如图

显现的对话框操作如图。

举例

对下例数据进行考查，是否存在明显差别。

因为检查数据分别在两栏，我们选择Samplesindifferentcolumns输入数据。

sample1 sample2

0 1

1 0

0 0

1 0

0 0

0 1

考查成果如下

TestandCIforTwoProportions:

sample1,sample2

Event=1

Variable X N Samplep

sample1 2 10 0.200000

sample2 2 10 0.200000

Difference=p（sample1）-p（sample2）

Estimatefordifference:

95%CIfordifference:

（-0.350609,0.350609）

Testfordifference=0（vsnot=0）:

Z=0.00 P-Value=1.000

*NOTE*Thenormalapproximationmaybeinaccurateforsmallsamples.→样本量太少，成果弗成靠

Fisher'sexacttest:

P-Value=1.000

简单的从P值来看，认为两者没有明显差别。

点击主对话框的options，将显现如图的对话框，其内容如图1。

个中是否选择useapooledestimateofpforthetest，运算方法不合，其差别如图2

2Variances

双样本方差齐性考查

重要比较两个样本的方差考查，菜单操作如图。

考查模型为

H0：

σ1=σ1

H1：

σ1≠σ1

双样本方差考查的对话框如图1。

Samplesinonecolumn：

数据储备在一栏内，那么数据输入Samples框中，数据标记输入Subscripts中。

Samplesindifferentcolumns：

两个样本的数据分别在两栏内，则分别将两栏数据的栏号输入First、Second。

Summarizeddata：

将两个样本数据的样本量和方差分别输入Samplesize、Variance。

*option对话框能够设置置信度程度，Storage对话框能够选择储备两个样本的标准差、方差或置信高低限。

示例

S1 S2

30.2441 29.3238

31.0379 30.0866

27.9622 30.3843

29.9718 31.4472

31.1175 31.1020

29.7028 30.6207

29.2911 28.9792

29.5267 29.3002

30.5728 30.4844

32.2077 30.6304

30.4481 31.0498

29.3376 29.1559

31.5307 29.1551

29.4860 30.3291

30.1718 30.4949

30.1388 30.2574

29.4959 30.9022

31.5960 27.9214

29.9977 30.2293

29.9297 30.7134

分析成果如图2

包含正态分布差不多上的考查成果（F-Test），和其它任何连续数据分布的考查成果（Levene'sTest）。

从P值来看，考查成果都无差别。

NormalityTest

正态性考查

经由过程抽样样本考查总体是否为正态分布。

minitab供给了3种考查方法，分别为Anderson-Darling（美国）、Ryan-Joiner（中国）、Kolmogorov-Smirnov（俄罗斯）可供选择。

别的能够在正态概率图上画出参考线，能够在Percentilelines中输入特定的值即可实现。

菜单操作Stat>BasicStatistics>NormalityTest

假设对下列数据进行考查。

同时想估量不良率的程度，规格为（12，24），应用Anderson-Darling方法考查成果如图。

能够从P值看出总体屈从正态分布，合格率为0.9477-0.0026=0.9451。

date

18.9000

18.4540

18.4418

20.9672

15.9194

14.9419

20.9746

20.1208

21.4498

21.4262

22.3970

14.9576

17.8887

19.7197

22.0388

19.7466

13.6395

18.7285

20.9326

17.7009

22.8862

20.7942

18.1364

18.7222

21.9095

21.9868

25.1861

17.8491

23.8443

17.0503

Regression

实际生活中的专门多现象之间存在着互相依附、互相制约的关系，这

展开阅读全文