spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx

上传人:b****9 文档编号:25169292 上传时间:2023-06-05 格式:DOCX 页数:26 大小:673.34KB
下载 相关 举报
spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx_第1页
第1页 / 共26页
spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx_第2页
第2页 / 共26页
spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx_第3页
第3页 / 共26页
spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx_第4页
第4页 / 共26页
spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx_第5页
第5页 / 共26页
点击查看更多>>
下载资源
资源描述

spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx

《spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx》由会员分享,可在线阅读,更多相关《spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx(26页珍藏版)》请在冰豆网上搜索。

spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析.docx

spss相关分析案例多因素方差分析及SPSS检验车辆运行速度案例分析

本次实验采用2005年东部、中部和西部各地区省份城镇居民月平均消费类型划分的数据(课本139页),将东部、中部和西部看作三个不同总体,31个数据分别来自于这三个总体。

本人对这三个不同地区的城镇居民月平均消费水平进行比较,并选取人均粮食支出、副食支出、烟酒及饮料支出、其他副食支出、衣着支出、日用杂品支出、水电燃料支出和其他非商品支出八个指标来衡量城镇居民月平均消费情况。

在进行比较分析之前,首先对个数据是否服从多元正态分布进行检验,输出结果为:

表一

TestsofNormality

Kolmogorov-Smirnova

Shapiro-Wilk

Statistic

df

Sig.

Statistic

df

Sig.

人均粮食支出(元/人)

.156

31

.054

.860

31

.001

人均副食支出(元/人)

.112

31

.200*

.932

31

.051

人均烟、酒、饮料支出(元/人)

.163

31

.036

.829

31

.000

人均其他副食支出(元/人)

.197

31

.004

.813

31

.000

人均衣着支出(元/人)

.145

31

.094

.945

31

.117

人均日用杂品支出(元/人)

.145

31

.094

.936

31

.063

人均水电燃料支出(元/人)

.146

31

.090

.897

31

.006

人均其他非商品支出(元/人)

.276

31

.000

.725

31

.000

a.LillieforsSignificanceCorrection

*.Thisisalowerboundofthetruesignificance.

如表一,因为该例中样本数n=31<2000,所以此处选用Shapiro-Wilk统计量。

由正态性检验结果的sig.值可以看到,人均粮食支出、烟酒及饮料支出、其他副食支出、水电燃料支出和其他非商品支出均明显不遵从正态分布(Sig.值小于0.05,拒绝服从正态分布的原假设),因此,在下面分析中,只对人均副食支出、衣着支出和日用杂品支出三项指标进行比较,并认为这三个变量组成的向量都遵从正态分布,并对城镇居民月平均消费状况做出近似的度量。

另外,正态性的检验还可以通过Q-Q图来实现,此时应判别数据点是否与已知直线拟合得好。

如果数据点均落在直线附近,说明拟合得好,服从正态分布,反之,不服从。

具体情况这里不再赘述。

下面进行多因素方差分析:

一、多变量检验

表二

MultivariateTestsc

Effect

Value

F

Hypothesisdf

Errordf

Sig.

Pillai'sTrace

.977

3.696E2a

3.000

26.000

.000

Wilks'Lambda

.023

3.696E2a

3.000

26.000

.000

Hotelling'sTrace

42.648

3.696E2a

3.000

26.000

.000

Roy'sLargestRoot

42.648

3.696E2a

3.000

26.000

.000

地区

Pillai'sTrace

.465

2.725

6.000

54.000

.022

Wilks'Lambda

.555

2.970a

6.000

52.000

.014

Hotelling'sTrace

.768

3.199

6.000

50.000

.010

Roy'sLargestRoot

.719

6.469b

3.000

27.000

.002

a.Exactstatistic

b.ThestatisticisanupperboundonFthatyieldsalowerboundonthesignificancelevel.

c.Design:

+地区

由地区一栏的(即第二栏)所列几个统计量的Sig.值可以看到,无论从那个统计量来看,三个地区的城镇居民月平均消费水平都是有显著差别的(Sig.值小于0.05,拒绝地区取值不同,对Y,即城镇居民月平均消费水平的取值没有显著影响的原假设)。

二、主体间效应检验

表三

TestsofBetween-SubjectsEffects

Source

DependentVariable

TypeIIISumofSquares

df

MeanSquare

F

Sig.

CorrectedModel

人均副食支出(元/人)

11612.395a

2

5806.198

8.880

.001

人均日用杂品支出(元/人)

66.367b

2

33.183

4.732

.017

人均衣着支出(元/人)

107.540c

2

53.770

.238

.790

人均副食支出(元/人)

340978.069

1

340978.069

521.476

.000

人均日用杂品支出(元/人)

3826.884

1

3826.884

545.775

.000

人均衣着支出(元/人)

121284.116

1

121284.116

536.028

.000

地区

人均副食支出(元/人)

11612.395

2

5806.198

8.880

.001

人均日用杂品支出(元/人)

66.367

2

33.183

4.732

.017

人均衣着支出(元/人)

107.540

2

53.770

.238

.790

Error

人均副食支出(元/人)

18308.394

28

653.871

人均日用杂品支出(元/人)

196.332

28

7.012

人均衣着支出(元/人)

6335.411

28

226.265

Total

人均副食支出(元/人)

389358.567

31

人均日用杂品支出(元/人)

4305.835

31

人均衣着支出(元/人)

130835.111

31

CorrectedTotal

人均副食支出(元/人)

29920.789

30

人均日用杂品支出(元/人)

262.698

30

人均衣着支出(元/人)

6442.951

30

a.RSquared=.388(AdjustedRSquared=.344)

b.RSquared=.253(AdjustedRSquared=.199)

c.RSquared=.017(AdjustedRSquared=-.054)

如表三,可以看到三个指标地区一栏的(即第三栏)Sig.值分别为0.001、0.017、0.790,说明三个地区在人均衣着支出指标上没有明显的差别(Sig.值大于0.05,不拒绝地区取值不同,对指标的取值没有显著影响的原假设),反之,而在人均副食支出和日用杂品支出指标上有显著差别。

三、多重比较

 

表四

ContrastResults(KMatrix)

地区SimpleContrasta

DependentVariable

人均副食支出(元/人)

人均日用杂品支出(元/人)

人均衣着支出(元/人)

Level1vs.Level3

ContrastEstimate

38.213

2.437

4.124

HypothesizedValue

0

0

0

Difference(Estimate-Hypothesized)

38.213

2.437

4.124

Std.Error

10.674

1.105

6.279

Sig.

.001

.036

.517

95%ConfidenceIntervalforDifference

LowerBound

16.349

.173

-8.738

UpperBound

60.078

4.701

16.985

Level2vs.Level3

ContrastEstimate

-5.059

-1.167

3.267

HypothesizedValue

0

0

0

Difference(Estimate-Hypothesized)

-5.059

-1.167

3.267

Std.Error

11.671

1.209

6.866

Sig.

.668

.343

.638

95%ConfidenceIntervalforDifference

LowerBound

-28.967

-3.642

-10.797

UpperBound

18.849

1.309

17.331

a.Referencecategory=3

如表四,在0.05显著水平下,东部和西部的人均副食支出(Sig.值为0.001)和日用杂品支出(Sig.值为0.036)指标有明显差别(小于0.05,拒绝原假设),而在人均衣着支出(Sig.值为0.517)指标上没有明显的差别。

并且东部的人均副食支出、衣着支出和日用杂品支出三项指标均高于西部地区,说明东部的城镇居民月平均消费水平较西部来说,高出很多,符合实际的情况。

另外,中部和西部的人均副食支出、衣着支出和日用杂品支出(Sig.值分别为0.668、0.343、0.638,均大于显著水平)三个指标均无明显差别,但中部的人均副食支出和日用杂品支出指标低于西部地区,人均衣着支出指标高于西部,说明中、西部的城镇居民月平均消费水平差不多,但消费结构有差异,符合实际的情况。

表五

MultivariateTestResults

Value

F

Hypothesisdf

Errordf

Sig.

Pillai'strace

.465

2.725

6.000

54.000

.022

Wilks'lambda

.555

2.970a

6.000

52.000

.014

Hotelling'strace

.768

3.199

6.000

50.000

.010

Roy'slargestroot

.719

6.469b

3.000

27.000

.002

a.Exactstatistic

b.ThestatisticisanupperboundonFthatyieldsalowerboundonthesignificancelevel.

表五是上面多重比较可信性的度量,由Sig.的值可以看到(均小于0.05),比较检验是可信的。

四、协方差阵相等检验

 

表六

Box'sTestofEqualityofCovarianceMatricesa

Box'sM

22.979

F

1.597

df1

12

df2

2.745E3

Sig.

.085

Teststhenullhypothesisthattheobservedcovariancematricesofthedependentvariablesareequalacrossgroups.

a.Design:

+地区

如表六,是协方差阵相等检验,检验统计量是Box’sM,由Sig.值0.085>0.05可以看到,可以认为三个地区(总体)的协方差阵是相等的。

表七

Levene'sTestofEqualityofErrorVariancesa

F

df1

df2

Sig.

人均副食支出(元/人)

1.605

2

28

.219

人均日用杂品支出(元/人)

1.817

2

28

.181

人均衣着支出(元/人)

2.763

2

28

.080

Teststhenullhypothesisthattheerrorvarianceofthedependentvariableisequalacrossgroups.

a.Design:

+地区

表七给出了各地区同一指标误差的方差检验,在0.05水平下,人均副食支出、衣着支出和日用杂品支出(Sig.值分别为0.219、0.181、0.080,均大于0.05)三个指标的误差平方在三个地区间均没有显著差别,这说明,除了地区因素外,其他因素对人均副食支出、衣着支出和日用杂品支出三个指标的影响很小。

综上所述,对三个地区的城镇居民月平均消费水平进行了具体的比较分析,所得结果表明,东部地区较中、西部地区的城镇居民月平均消费水平差别较大,远高于中、西部两个地区。

而中部和西部之间的城镇居民月平均消费水平差别不太明显,主要是消费结构有所不同,这说明西部地区在国家施行西部大开发政策之后发展很快,人民生活水平显著提高,赶上中部地区,体现政策的有效性。

SPSS检验车辆运行速度案例分析

某道路弯道处53车辆减速前观测到的车辆运行速度,试检验车辆运行速度是否服从正态分布。

这道题目的解答可以先通过绘制样本数据的直方图、P-P图和Q-Q图坐车粗略判断,然后利用非参数检验的方法中的单样本K-S检验精确实现。

一、初步判断

1.1绘制直方图

(1)操作步骤

在SPSS软件中的操作步骤如图所示。

(2)输出结果

通过观察速度的直方图及其与正态曲线的对比,直观上可以看到速度的直方图与正太去线除了最大值外,整体趋势与正态曲线较吻合,说明弯道处车辆减速前的运行速度有可能符合正态分布。

1.2绘制P-P图

(1)操作步骤

在SPSS软件中的操作步骤如图所示。

(2)结果输出

根据输出的速度的正态P-P图,发现速度均匀分布在正态直线的附近,较多部分与正态直线重合,与直方图的结果一致,说明弯道处车辆减速前的运行速度可能服从正态分布。

二、单样本K-S检验

2.1单样本K-S检验的基本思想

K-S检验能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优的检验方法,适用于探索连续型随机变量的分布。

单样本K-S检验的原假设是:

样本来自的总体与指定的理论分布无显著差异,即样本来自的总体服从指定的理论分布。

SPSS的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。

单样本K-S检验的基本思路是:

首先,在原假设成立的前提下,计算各样本观测值在理论分布中出现的累计概率值F(x),;其次,计算各样本观测值的实际累计概率值S(x);再次,计算实际累计概率值与理论累计概率值的差D(x);最后,计算差值序列中的最大绝对值差值,即

通常,由于实际累计概率为离散值,因此D修正为:

D统计量也称为K-S统计量。

在小样本下,原假设成立时,D统计量服从Kolmogorov分布。

在大样本下,原假设成立时,

近似服从K(x)分布:

当D小于0时,K(x)为0;当D大于0时,

容易理解,如果样本总体的分布与理论分粗的差异不明显,那么D不应较大。

如果D统计量的概率P值小于显著性水平α,则应拒绝原假设,认为样本来自的总体与指定的分布有显著差异如果D统计量的P值大于显著性水平α,则不能拒绝原假设,认为,样本来自的总体与指定的分布无显著差异。

在SPSS中,无论是大样本还是小样本,仅给出大样本下的和

对应的概率P值。

2.2软件操作步骤

单样本K-S检验的操作步骤如图所示

2.3输出结果并分析

SPSS的输出结果如表所示.

单样本Kolmogorov-Smirnov检验

速度

N

98

正态参数a,b

均值

47.988

标准差

11.6310

最极端差别

绝对值

.090

.050

-.090

Kolmogorov-SmirnovZ

.888

渐近显著性(双侧)

.409

a.检验分布为正态分布。

b.根据数据计算得到。

该表表明,速度的均值为47.988,标准差为11.6310。

最大绝对差值为0.090,最大正差值为0.050,最大负差值为-0.090。

本例应采用大样本下D统计量的精确概率值,输出了根号nD值0.888和概率P值0.409,如果显著性水平为0.05,由于概率P值大于显著性水平,因此不能拒绝原假设,可以认为弯道处车辆减速前的运行速度服从正态分布。

 

第13题

表中数据为某条公路上观测到的交通流速度与密度数据,试用一元线性回归模型分析两者的101关系。

一、一元线性回归的基本原理

1.1一元线性回归模型:

上述模型可分为两部分:

(1)

是非随机部分;

(2)

是随机部分。

β0和β1为回归常熟和回归系数该式被称为估计的一元线性回归方程。

1.2模型参数估计

用最小二乘法估计参数,是在关于随机误差的正态性、无偏性、同方差性、独立性这四个假设的基础上进行的。

为了求回归系数,

,令一阶导数为0,得:

从中解出:

二、一元线性回归分析的假设检验:

其中:

SST称为总体离差平方和,代表原始数据所反映的总偏差的大小。

SSR称为回归离差平方和,它是由变量x引起的偏差,反应x的重要程度

SSE称为剩余离差平方和,它是由实验误差以及其它未加控制因素引起的偏差,反映了试验误差及其它随机因素对试验结果的影响。

2.1回归方程优度检验的

相关系数反映了由于使用Y与X之间的线性回归模型来估计y的均值,而导致总离差平方和减少的程度。

它与SSR成正比,R2的取值在0-1之间,其值越接近1,说明方程对样本数据点的拟合度越高;反之,其越接近0说明,明模型的拟合度越低。

2.2回归方程的显著性检验

假设

成立的条件下,有:

上式中,n1=1,n2=n-2,F服从自由度为(1,n-2)的F分布。

给定显著水平

,若

拒绝原假设,表明回归效果显著。

2.3回归系数的显著性检验

成立的条件下,有:

时,拒绝原假设,回归显著。

注意:

注意回归方程的显著性检验与回归系数的显著性检验的的区别:

回归系数的显著性检验是用于检验回归方程各个参数是否显著为0的单一检验,回归方程的显著性检验是检验所有解释变量的系数是否同时为0的联合检验,分别为t检验FF检验。

对于一元线性回归模型,F检验与t检验是等价的,而对于二元以上的多元回归模型,解释变量的整体对被解释变量的影响是显著的,并不表明每一个解释变量对它的影响都显著,因此在做完F检验后还须进行t检验。

2.4残差均值为零的正态性分析,

进行一元线性回归建模的前提是残差ε~N(0,δ2)。

而结实变量x去某个特定的值是,对应的残差必然有证有负,但总体上应服从已领为君值得正态分布。

可以通过绘制残插图对该问题进行分析。

残插图是一种散点图,途中横坐标是结实变量,纵坐标为残差。

如果残差的均值为零,则残插图中的点应在纵坐标为零的横线上、下随机散落。

三、软件操作

一元线性回归的软件操作步骤如图所示。

四、输出结果

SPSS的输出结果如表所示。

模型汇总b

模型

R

R方

调整R方

标准估计的误差

1

.972a

.944

.941

10.0432

a.预测变量:

(常量),密度。

b.因变量:

速度

该表中格列数据的含义(从第二列开始)依次是:

被解释变量和解释变量的负相关系数、判定系数R2、调整的系数R2、回归方程的估计标准误差。

依据该表可以进行拟合优度检验。

由于判定系数R2较接近1,因此认为拟合优度较高,被解释变量可以被模型解释的部分较多,不能被模型解释的部分较少。

Anovab

模型

平方和

df

均方

F

Sig.

1

回归

37276.268

1

37276.268

369.566

.000a

残差

2219.031

22

100.865

总计

39495.298

23

a.预测变量:

(常量),密度。

b.因变量:

速度

该表各项数据的含义(从第一列开始)依次为:

被解释变量的表差来源,离差平方和。

自由度、方程、回归方程显著性检验中F检验统计量的观测值和概率P值。

由表可知,F检验统计量的观测值为,369.56,对应的概率P值为0.000。

如果显著性水平取0.05,由于概率P值小于显著性水平,所以应该拒绝原假设,认为,被解释变量与及时变量的线形关系是显著的,可以建立线性模型。

系数a

模型

非标准化系数

标准系数

t

Sig.

B

标准误差

试用版

1

(常量)

153.344

3.987

38.462

.000

密度

-3.893

.202

-.972

-19.224

.000

a.因变量:

速度

该表中各列数据的含义(第二列开始)依次为:

偏回归系数,偏回归系数的标准误差,标准化偏回归系数、回归系数显著性检验中t检验统计量的观测值、对应的概率P值。

从表中可以看出,产量和密度对应的概率P值均为0.000。

若取显著性水平为0.05,则应拒绝原假设,认为密度与速度的线性关系显著。

残差统计量a

极小值

极大值

均值

标准偏差

N

预测值

2.312

123.371

87.608

40.2580

24

残差

-11.8622

21.2178

.0000

9.8224

24

标准预测值

-2.119

.888

.000

1.000

24

标准残差

-1.181

2.113

.000

.978

24

a.因变量:

速度

该表中可以看出,残差和标准残差的均值均为0,符合残差均值为零的正态性分析。

综上,该公路上速度与密度的一元线性回归模型为:

,其中,V表示速度,K表示密度。

 

第17题

为了分析双车道公路上驾驶人超车行为及其影响因素,应用超车试验研究了超车过程中同向的车流间隙对驾驶人换车道的影响。

此次试验共采集到有效样本数据342条,表中给出了部分试验数据整理结果。

请用logistic回归模型标定出换道行为模型。

本题可采用二元logistic回归分析对换道行为进行标定。

一、二元Logistic回归基本原理

当被解释变量为0/1二分类变量时,虽然无法直接采用一般线性回归模型建模,但可充分借鉴其理论模型和分析思路。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 工程科技 > 能源化工

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1