使用MINTAB进行回归分析.docx

资源描述

使用MINTAB进行回归分析.docx

《使用MINTAB进行回归分析.docx》由会员分享，可在线阅读，更多相关《使用MINTAB进行回归分析.docx（14页珍藏版）》请在冰豆网上搜索。

使用MINTAB进行回归分析.docx

使用MINTAB进行回归分析

如何使用MINTAB进行回归分析

回归分析用来检验并建立一个响应变量与多个预测变量之间的关系模形。

MINITAB提供了多种最小二乘法和推理回归程序。

当响应变量为连续的量值时使用最小二乘法

当响应变量为分类值时使用推理回归。

最小二乘法和推理回归方法都是评估关系模型中的参数并使模型的按按拟合值达到最优化。

最小二乘法是使误差平方和以获得参数估计值。

但是MINITAB的推理回归命令是获得参数最大概率估计。

参考2-29页推理回归概要以获得更多关天推理回归分析信息。

使用下表来帮助选择适当的程序。

选择的程序

适合的条件

响应类型

评估方法

回归

执行简单或多元回归分析：

选择合适的关系模型、存贮回归统计量、检验残差分析、产生点估计、产生预测和置信区间以及进行LACK-FIT检验。

连续型

最小二乘法

逐步回归分析

为了识别预测因素中有用的子集，执行逐步、进一步选择以及后退消除等方法从关系模型中增加或消除变量。

连续型

最小二乘法

最佳子集

识别以R2为基础的预测因子最佳子集。

连续型

最小二乘法

拟合线性图

使用单个预测因子执行线性和多项回归，并且用数据绘制回归线。

以实际和log10为基础。

连续型

最小二乘法

残差图

产生一组残差图用来进行残差分析。

正常score图，单值残差图，残差柱状图以及残差和拟合图。

连续型

最小二乘法

二元推理分析

进行响应可能只有两个值的回归分析，例如：

存在或不存在。

分类

最大概率

顺序推理

对响应可能有三个或更多的值的响应进行回归分析，该响应值有自然的顺序，例如：

无影响、中等影响、严重影响。

分类

最大概率

名义推理

对响应可有三个或更多的值的响应进行回归分析，该响应值没自然的顺序，例如：

甜、咸、酸

分类

最大概率

回归

您可以使用回归方法来进行用最小二乘法为基础的一元和多元回归分析。

使用本程序您可以产生最小二乘法关系模型，贮存回归统计量，检验残差，产生点估计、进行预测以及置信区间，并且可以进行lack-of-fit检验。

同时您也可以使用该命令产生多元回归关系模型。

然而，如果您要使用一个预测因子来获得一个多元回归关系模型，您将会发现使用拟合线性图更好。

数据

在数字型列中输入相等长度的响应和预测因子变量，这样您的工作表中每行的数据包含着对应观察值的测量结果。

在回归方程计算和方差分析表中，MINITAB忽略了响应或预测因子中所有包含丢失值的观测值列。

线性回归分析

1.选择统计>回归>回归

2.在“响应”栏中，输入包含响应变量（Y）的列。

3.在“预测因子”栏中输入包含预测因子（X）变量的列。

4.如果需要的话，可以使用下面显示的选项，然后单击“确立”

选项

图形子对话框

为正常、标准、已删除残差图画5个不同的残差图。

参考-----2-5页选择残差图类型。

有效的残差图包括：

柱状图

正态概率图

残差图及拟合值

残差图及数据顺序。

每个数据点的行号都显示在图中X轴上。

（例如：

12345…n）

独立的残差图及每个选定列。

参考2-6页的残差图。

结果子对话框

在对话窗口中显示下列内容：

不输出

估计的回归关系方程，系数表、S，R2,以及方差分析表。

默认的输出设置，包括上面的输出方式加上连续平方和fitsandresidualsofunusualobservations

选项子对话框

执行加权回归分析-----参考2-6页加权回归分析

excludetheintercepttermfromtheregressionbyuncheckingFitIntercept—see

Regressionthroughtheoriginonpage2-7

显示varianceinflation因子（VIF---共线性影响度量值）

与每个预测因子相关-----参考2-7页Varianceinflationfactor

显示杜宾-瓦特森统计，它是用来检测残差的自相关—参考2-7页检测残差的自相关

显示PRESS统计以及校正的R2。

当预测因子重复时，用纯误差lack-of-fit来检验关系模型的适合性，---参考2-8页检验lack-of-fit

用数据子子集lack-of-fit测试来检验关系模型的适合性---参考2-8页检验lack-of-fit

预测响应结果、置信区间以及新观测值的区间---参考2-9页新的观测值的预测。

存储子对话框

存储系数、拟合值、以及正常、标准、已删除残差图---参考2-5页选择残差类型。

nstoretheleverages,Cook’sdistances,andDFITS,foridentifyingoutliers—see

Identifyingoutliersonpage2-9.

存储

storethemeansquareerror,the（X'X）-1matrix,andtheRmatrixoftheQRor

Choleskydecomposition.（Thevariance-covariancematrixofthecoefficientsis

MSE*（XX）-1.）SeeHelpforinformationonthesematrices.

残差分析及回归推断

当建立了回归关系模，回归分析通常没有完成。

您同样也可以检验残差图和其它回归推理来评定残差图是否是随机和正态分布。

MINITAB通过图形子对话图提供许多残差图，做为选择，关系模型及残差被存储以后，您可以使用统计>回归>残差图命令可以在同一图形窗口获得四个残差图。

MINITAB也可以用回归推理来识别不正常的观测值，这些观测值可能对回归结果产生很显著的影响，参考2-9页识别OUTLIERS，您可检验一下这些异常数据看它们是否正确。

假如这样的话，您可以确定它们为什么产生异常以及它们对回归关系方程有什么影响。

您也可以验证当存在OUTLIERS时，回归结果的敏感程度。

Outliers可以暗示关系模型不充分或者需要另外的信息。

选择残差类型

您可以计算三各残差类型，使用下表可以帮助您选择哪种图形。

残差类型

选择您需要列

计算方法

常规

examineresidualsintheoriginalscaleofthedata

response-fit

标准

使用ruleofthumb来识别与关系模型关联关系不十分密切的观测值。

一个标准的残差绝对值大于2，MINITAB将这些观测值显示在异常观测值表中，并有R表示。

（残差）/（残差的标准差）

Studentized

识别与关系模型关联关系不十分密切的观测值，删除影响变量估计及参数估计的观测值。

较大的Studentized残差绝对值表明关系模型中包含该观测值将会增大误差变化或者它对参数的估计有很大的影响，或者对二者都有影响。

（残差）/（残差的标准差）

第I个studentized残差值是用第I个被删除的观测值计算出来的。

残差图

MINITAB可以产生残差图这样您就可以验证您建立的关系模型的拟合度，您可以选择以下残差图：

残差正态分布图：

如果残差服从正态分布，图中的点将基本形成一条直线。

如果图中的点背离了该直线，残差服从正态布的假设就会不成立，检验数据是否服从正态分布，可以使用统计>基本统计>正态检验（1-43）。

残差柱状图：

该图必须类似正态分布图并且其平均值为0（钟形），许多点串远离零点，关系模型之外的因子可能影响了您的结果。

残差及拟合度：

本图应该显示的是残差应是随机的分布在0周围。

在残差图内应该没有任何recognizablepatterns，以下的几点可以说明残差图是非随机的：

----几点连续上升或下降

----绝大部分的点是正残差，或绝大部的点是负残差。

–patternssuchasincreasingresidualswithincreasingfits

残差与顺序图：

本图所有残差都是按照数据搜集顺序排列的，它可以用来发现非随机错误，特别是与时间相关的影响。

残差图与其变量图：

这是个残差与其它变量图。

一般地，你可以使用关系模型中预测因子或变量来检查一下您的是否有您想要图形。

如果某些残差值被考虑，您可以用刷子工具来标识这些值，您可以参考MINITAB使用者指南中BrushingGraphs的章节。

加权回归分析

加权最小二乘法回归分析用来分析观测值中包含有非常量变量的一种方法。

如果变量不是常量变量那么：

1）带有大变量的观测值应相应地加上较小的权重。

2）带有小变量的观测值应相应地加上较大的权重。

一般情况的权重是响应中纯误差变量相反值。

Theusualchoiceofweightsistheinverseofpureerrorvarianceintheresponse.

加权回归分析

1.选择统计>回归>回归>选项

2.在“权重”栏中，输入包含权重的列，权重必须大于或等于0，在每个对话框中单击“确定”

3.在数据组中有n个观测值，MINITAB产生了n⨯n的矩阵W，权重列作为矩阵的对角和零点。

MINITAB使用（X'WX）-1（X'WY）来计回归系数，这样就等于将加权平方和误差最小化。

，式中wi为权重。

通过原点的回归

一般的情况下，y截矩（也叫常数项）被包含在等式，因此minitab选用下面关系模型：

然而，如果在x=0时，响应值也自然为0时，可以选用一个没有截矩的关系模型。

如果是这样，在选项子对话框中，不选截矩项，并且β0项就会被忽略，minitab选用下面的关系模型：

因为当没有常数项解释R2是非常困难的，所以R2没有显示出来。

如果您想比较带有截矩项与不带有截矩项关系模型的拟合度，可以进行平均值平方误差及验证残差图。

变量inflationfactor

Thevarianceinflationfactor（VIF）用来检测一个预测因子和剩下的预测因子是否有很强的线性关系（预测因子中存在多重共线性）。

如果您的预测因子是相关的（或多重线性相关）时，VIF测量的是估计的回归因子增加程序。

VIF>=1时表明因子之间不相关，所有预测因子中最大的VIF通常是用来作为多重共线性的指示。

MontgomeryandPeck[21]建议当VIF大于5-10时，回归系数估计得毫无结果。

你应该考虑使用选项中的方法来分散预测因子间的多重共线性：

重新搜集数据，删除预测因子，使用不同的预测因子或最小二乘法回归分析的替代，获得附加的信息请参考[3],[21].。

检验残差的自相关

在线性回归分析中，我们总是假设残差都是彼此相互独立的（即它们之间不存大自相关）。

如果相互独立的假设被破坏，一些关系模型的拟合

展开阅读全文