Minitab实战.docx

上传人:b****6 文档编号:8551234 上传时间:2023-01-31 格式:DOCX 页数:55 大小:2.14MB
下载 相关 举报
Minitab实战.docx_第1页
第1页 / 共55页
Minitab实战.docx_第2页
第2页 / 共55页
Minitab实战.docx_第3页
第3页 / 共55页
Minitab实战.docx_第4页
第4页 / 共55页
Minitab实战.docx_第5页
第5页 / 共55页
点击查看更多>>
下载资源
资源描述

Minitab实战.docx

《Minitab实战.docx》由会员分享,可在线阅读,更多相关《Minitab实战.docx(55页珍藏版)》请在冰豆网上搜索。

Minitab实战.docx

Minitab实战

minitab操作

有些时候我们在复制数据进入minitab后,由于分析的需要,需要对数据的排列进行处理,我们会有很多偷懒

的方法,先看看下图的命令菜单。

●它们分别为堆叠栏、堆叠栏块、堆叠行。

针对下图的数据

我们在选择上面的堆叠栏时,出现如图的对话框,并如图输入指令时,

堆叠行的对话框操作基本与堆叠栏相同,输出的不同可以根据附图看出。

堆叠的操作在很多的分析中可以应用,如方差分析、测量系统分析、控制图等等。

●转换栏操作1

有些时候我们的数据需要从栏的顺序结构转换为行的结构,这时可以使用转换栏操作,如图。

●转换栏操作2

利用转换栏的操作,针对下图1的数据,进行图2的对话框操作后的结果如图1。

==将A、B栏的数据转换为行的格式。

 

转换栏前后数据

●按序排列数据

有时为了分析和观察的方便,需要将数据按某栏的数据大小进行排列,这是可以使用sort命令,对话框如图。

针对图1的数据按图2对话框操作以后的数据排列效果如图1。

●栏运算1

在进行minitab分析时,有时需要对数据进行简单的运算或函数运算,完成这个功能的菜单操作如图1,出现的对话框及简要的操作方法如图2。

sample

针对图中的C1栏进行简单运算和对数运算的结果如图。

●行、栏统计1

我们有时需要对某一栏或行的数据进行一些基本统计,执行如图菜单可帮帮你。

在执行菜单后出现的对话框如图,此命令一次只提供一个基本统计参数的运算,包括:

均指、和、方差、极值、缺失数据等,然后输入需要计算的栏或行所在栏组就可以了。

●标准化操作

标准化结合与分布概念应该不是一个陌生的名词,minitab的操作菜单如图。

从出现的对话框来看,minitab提供5种标准化的方法:

1.减去均值并除以标准差;

2.减去均值;

3.除以标准差;

4.减去指定的值并除以指定的值;

5.将数据标准化,使得数据变化在某个范围内。

什么是标准化结合?

是标准化操作,例如将均值为μ,标准差为σ的正态分布转化为标准正态分布,其操作就是(x-μ)/σ,这个应用是很重要的。

各种常见的标准化操作上面讲的5种,但应用第一种居多。

●生成模板数据

有时我们在进行输入数据的时候,有些数据是呈现某种规律的,但一个个输入就显得比较麻烦,我们可以试试生成模板数据这个操作,菜单操作如图。

生成模板数据共有5种:

1.等距数据的生成

2.自定义数列数据的生成

3.自定义文本数据的生成

4.等距日期数据的生成

5.自定义日期数据的生成

等距数据的操作如图1,例如生成简单的1到3的数据,间距为1,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2。

生成自定义数列数据的对话框如图,例如生成数列为1、3、9的数据,每个数据重复2次,总体重复两次,按图1操作后,输出结果如图2。

对于其它几种模板数据的生成方式,操作基本与上面讲述的对话框操作及生成结果相似,例如自定义文本数据的生成,就是在Textvalues(e.g.,red"lightblue")框中输入要生成的文本数列就可以了,如a、b、c。

●生成随机数据

进行随机抽样或生成各种分布的随机数据,可以进行一些验证分析和抽样分析,其菜单操作如图。

选择上面菜单的SampleFromColumns,出现进行随机抽样的对话框及操作如图1。

例如我们要从总体为1-10的数据中随机抽取5个样本,则在Sample___rowsfromcolumn(s)中输入5,并给出总体数据1-10所在栏,选择存储位置,选择是否重复抽样等后,输出结果如图2。

如果抽取的样本量大于总体数据量,就必须选择Samplewithreplacement,也就是允许重复抽样,例如从1-10中抽取12个数据,输出如图2。

生成随机数菜单的后续选项主要就是生成服从各种分布的随机数据,其输入的内容主要是:

1.生成分布数据的样本量为多少

2.存储数据的栏

3.确定分布的参数值给定,如正态分布的均值和标准差,卡方分布的自由度,F分布的分子和分母自由度。

以下是生成卡方分布的示例:

1.样本量为10

2.生成10组,分别存储于C1-C10

3.自由度给定为5

对话框的输入和数据输出结果如图。

其它的分布数据生成类似。

●很多时候我们因为没有现成的分布概率表,所以无从查起,minitab中提供了这个功能,如附图所示菜单操作,它提供了多种分布的概率密度函数值、累积概率密度及分位数值得计算。

在出现的对话框中,请求选择的也是这三个值,任君选择,三个值得图形含义见附图2。

示例

需求标准正态分布的均值位置的累积概率。

对话框输入如图,结果如下:

CumulativeDistributionFunction

Normalwithmean=0andstandarddeviation=1

x  P( X <= x 

0      0.5

示例2

需计算标准正态分布的0.9分位数,操作如图,输出结果如下:

InverseCumulativeDistributionFunction

Normalwithmean=0andstandarddeviation=1

P( X <= x 

      x

      0.9  1.28155

●基本描述性统计1

我们在得到简单的样本数据之后,希望对其进行一些基本的描述性统计分析,从分析中对总体做出一些估计,比如参数的水平、离散程度、分布形态等等,对我们做进一步的分析有很大的作用。

描述性统计包括3个菜单项,如图,其结果基本相等,最后者默认多了几个图形、置信区间及正态的检验。

我们将displayDescriptiveStatistics和stroeDescriptiveStatistics一并讲述,其菜单操作完全一致,只是后者在woksheet窗口存储分析结果。

以以下数据进行描述性统计分析示例,菜单操作如图,在Variables中输入数据,在Byvariables输入分组的指标栏(如果存在分组的情况)。

机台    数据

1    105

1    106

1    109

1    103

1    108

2    92

2    97

2    90

2    99

2    95

默认的分析参数结果如下

DescriptiveStatistics:

数据

Variable  机台  N  N*  Mean  SEMean  StDev  Minimum  Q1  Median    Q3

数据    1    5  0  106.20    1.07    2.39  103.00  104.00  106.00  108.50

        2    5  0    94.60    1.63    3.65  90.00  91.00  95.00  98.00

Variable  机台  Maximum

数据    1    109.00

        2    99.00

其中的输出包括均值、均值标准差、样本标准差、极值、一三分位数

在描述统计的主队框内还有两个复选的对话框,statistics和graphs,前者对分析结果的中的统计参数进行设置,后者可以生成相应的图形。

graphicalsummary

图形概要分析,将部分图形和数据分析结果整合为一张图形,菜单操作为Stat>BasicStatistics>GraphicalSummary,其对华框输入很简单,如图1,例如对以下数据的分析,分析结果如图2。

date

20.6760

20.4807

20.2388

19.5027

19.2971

22.3003

17.7818

19.9037

20.3809

20.0546

20.0162

20.7074

21.3276

20.5386

19.6196

18.9708

19.9232

20.3483

20.6612

20.6077

18.0273

19.9562

19.5547

20.6370

21.6431

20.2904

20.7241

19.2214

19.9852

19.0299

1-SampleZ

Stat>BasicStatistics>1-SampleZ

单样本Z检验,假设检验的一种,检验样本的均值水平,总体的标准差已知(一般来源于可靠有效的历史数据结果或某些特殊场合)的情况。

例如针对以下数据,检验原假设为样本均值等于34,检验的对话框操作如图。

date

30.1085

30.1348

29.1167

31.3980

30.3632

30.1460

31.3888

30.4308

30.6547

31.0456

30.4946

29.5554

31.4230

31.9619

30.5474

29.2900

29.7606

30.5125

31.1061

29.6948

29.5461

29.8016

28.8727

30.4455

29.8649

30.5563

30.0517

28.6718

30.3047

31.4132

minitab输出结果为,P值近似为0,说明拒绝原假设,均值不等于34。

One-SampleZ:

date

Testofmu=34vsnot=34

Theassumedstandarddeviation=1

Variable  N    Mean  StDev  SEMean      95%CI          Z      P

date    30  30.2887  0.8032  0.1826  (29.9309,30.6466)  -20.33  0.000

点击1-samplettest对话框的options,弹出对话框如图,其中可以自行输入置信度水平和选择假设检验的备择假设形式。

1-samplettest

单样本t检验与单样本Z检验虽然在操作上比较相同,但其应用是不同的,单样本t检验主要针对总体标准差未知的情况。

针对上例的数据,采用1-sample  t检验,操作如图,结果如下:

One-SampleT:

date

Testofmu=34vsnot=34

Variable  N    Mean  StDev  SEMean      95%CI        T    P

date    30  20.0802  0.9415  0.1719  (19.7286,20.4318)  -80.98  0.000

(options复选对话框的操作意义相同)

2-samplettest

Stat>BasicStatistics>2-Samplet

双样本t检验,比较两个水平是否有显著差别或者两个水平的大小比较问题。

在进行检验时,首先确定数据的正态性和方差其性,因为双样本t检验是在总体呈正态分布的基础上进行的,而且方差不同检验的方法也不同。

假设对以下数据的检验,先验证正态性及方差齐性,然后进行双样本t检验,菜单操作如图。

输出结果如下,我们从p值可以得出结论,两个工厂间存在显著的差别。

Two-SampleT-TestandCI:

甲工厂,乙工厂

Two-sampleTfor甲工厂vs乙工厂

      N  Mean  StDev  SEMean

甲工厂  10  50.25  1.18    0.37

乙工厂  10  55.175  0.662    0.21

Difference=mu(甲工厂)-mu(乙工厂)

Estimatefordifference:

  -4.92678

95%CIfordifference:

  (-5.82624,-4.02731)

T-Testofdifference=0(vsnot=):

T-Value=-11.51  P-Value=0.000  DF=18

BothusePooledStDev=0.9573

甲工厂    乙工厂

49.2619    54.4834

51.1988    55.9786

51.1832    56.1006

50.0621    54.6117

51.1369    55.1237

50.7307    55.1400

49.2937    54.6925

51.7491    54.3854

47.9031    56.0615

49.9637    55.1736

对话框的补充

1.提供3种数据输入形式

  〉数据在一栏,水平标志在一栏,选择Samplesinonecolumn,在Samples中输入数据所在栏,在Subscripts输入水平标志。

  〉两个水平的数据分别在两栏,选择Samplesindifferentcolumns,在First和second中分别输入两个水平数据所在的栏。

  〉已知两个水平的样本量、均值和标准差而没有详细的样本数据,则选择Summarizeddata,在Samplesize、Mean、Standarddeviation中分别输入两个水平的样本量、均值和标准差。

2.Assumeequalvariances选项,如果两个水平方差相等,则点选此项,否则不选,minitab将执行不同的分析方法。

3.graphs复选对话框,选择将出现如图1的对话框,可以选择生成置信区间图或箱线图。

4.options复选对话框,选择将出现如图2的对话框,可以确定分析的置信度水平,以及检验时的水平间的差值和备选假设的模式。

  注意这是的备择假设模式如果是大于或小于是,minitab默认将第一个样本放在前面,第二个样本放在后面。

Pairedt

在介绍成对t检验前,先将以下成对t检验的概念

************    

    我们在进行2samplet检验时,差异仅由因素水平不同引起,但有时候却并不是这样,那就是除了因素水平不同引起的差异外(我们要检验的),那就是每次实验还受另外一个变量的影响,也就是说,这个变量对每次实验的两个水平的影响相同,但对多次实验之间的影响就有区别,这时候就不能简单的将两个水平的样本进行比较,而是对两个水平的差值进行比较,这样就将另外的变量的影响排出了,计算的结果也就可靠,就好像控制图内组内和组间的概念,因素水平的影响就反映在组内(若干个同一次实验)了。

    举个通俗的例子,我们要比较两种鞋底的耐磨程度,于是选择20个人进行实验,每个人两只脚分别穿一种鞋底作的鞋,在这里,我们可以看到,除了两种鞋底的不同引起的耐磨效果不同外,20个人体重的不同也是一个影响,这是要单独的考量鞋底不同的影响,就要排除体重这个变量,怎么办呢,成对T检验,就是这样一个概念,将每个人的磨损情况做差值进行分析。

************

菜单操作Stat>BasicStatistics>Pairedt

如图

只要了解了pairett与2samplet的区别,其对话框的操作类似,数据分别存储在两个栏内,在对话框直接选择进入first和second复选框内就可以。

graph、option操作意义相同。

1.如何进行等方差检验

后续会讲到及minitab操作

2.方差等和不等是2samplet检验有何不同

请看附图,主要是统计参数和自由度的计算不同。

1Proportion

单比例P检验

菜单操作:

Stat>BasicStatistics>1Proportion

主对话框如图1

数据输入两种

  Samplesincolumns:

将检查结果数据直接输入

  Summarizeddata:

输入检查总数在Numberoftrials,输入合格总数在Numberofevents。

options对话框如图2

  Confidencelevel:

置信度水平

  Testproportion:

检验比率

  Alternative:

备择假设模式

  Usetestandintervalbasedonnormaldistribution:

在正态分布的基础上检验(一般样本量较大的场合)

2Proportions

双样本P检验,菜单操作如图

出现的对话框操作如图。

举例

对下例数据进行检验,是否存在显著差别。

由于检查数据分别在两栏,我们选择Samplesindifferentcolumns输入数据。

sample1    sample2

0    1

1    0

0    0

0    0

0    0

1    0

0    0

0    0

0    0

0    1

检验结果如下

TestandCIforTwoProportions:

sample1,sample2

Event=1

Variable  X  N  Samplep

sample1  2  10  0.200000

sample2  2  10  0.200000

Difference=p(sample1)-p(sample2)

Estimatefordifference:

  0

95%CIfordifference:

  (-0.350609,0.350609)

Testfordifference=0(vsnot=0):

  Z=0.00  P-Value=1.000

*NOTE*Thenormalapproximationmaybeinaccurateforsmallsamples.→样本量太少,结果不可靠

Fisher'sexacttest:

P-Value=1.000

简单的从P值来看,认为两者没有显著差别。

点击主对话框的options,将出现如图的对话框,其内容如图1。

其中是否选择useapooledestimateofpforthetest,计算方法不同,其区别如图2

2Variances

双样本方差齐性检验

主要比较两个样本的方差检验,菜单操作如图。

检验模型为

H0:

σ1=σ1

H1:

σ1≠σ1

双样本方差检验的对话框如图1。

  Samplesinonecolumn:

数据存储在一栏内,那么数据输入Samples框中,数据标志输入Subscripts中。

  Samplesindifferentcolumns:

两个样本的数据分别在两栏内,则分别将两栏数据的栏号输入First、Second。

  Summarizeddata:

将两个样本数据的样本量和方差分别输入Samplesize、Variance。

  

  *option对话框可以设置置信度水平,Storage对话框可以选择存储两个样本的标准差、方差或置信上下限。

示例

S1        S2    

30.2441    29.3238

31.0379    30.0866

27.9622    30.3843

29.9718    31.4472

31.1175    31.1020

29.7028    30.6207

29.2911    28.9792

29.5267    29.3002

30.5728    30.4844

32.2077    30.6304

30.4481    31.0498

29.3376    29.1559

31.5307    29.1551

29.4860    30.3291

30.1718    30.4949

30.1388    30.2574

29.4959    30.9022

31.5960    27.9214

29.9977    30.2293

29.9297    30.7134

分析结果如图2

包括正态分布基础上的检验结果(F-Test),和其它任何连续数据分布的检验结果(Levene'sTest)。

从P值来看,检验结果都无差别。

NormalityTest

正态性检验

通过抽样样本检验总体是否为正态分布。

minitab提供了3种检验方法,分别为Anderson-Darling(美国)、Ryan-Joiner(中国)、Kolmogorov-Smirnov(俄罗斯)可供选择。

另外可以在正态概率图上画出参考线,可以在Percentilelines中输入特定的值即可实现。

菜单操作Stat>BasicStatistics>NormalityTest

假设对下列数据进行检验。

而且想估计不良率的水平,规格为(12,24),运用Anderson-Darling方法检验结果如图。

可以从P值看出总体服从正态分布,合格率为0.9477-0.0026=0.9451。

date

18.9000

18.4540

18.4418

20.9672

15.9194

14.9419

20.9746

20.1208

21.4498

21.4262

22.3970

14.9576

17.8887

19.7197

22.0388

19.7466

13.6395

18.7285

20.9326

17.7009

22.8862

20.7942

18.1364

18.7222

21.9095

21.9868

25.1861

17.8491

23.8443

17.0503

Regression

现实生活中的许多现象之间存在着相互依赖、相互制约的关系,这些关系在量上主要有两种类型:

1.确定性关系,即我们所熟悉的变

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 解决方案 > 学习计划

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1