北京市交通系统研究.docx

上传人:b****6 文档编号:7044234 上传时间:2023-01-16 格式:DOCX 页数:13 大小:267.13KB
下载 相关 举报
北京市交通系统研究.docx_第1页
第1页 / 共13页
北京市交通系统研究.docx_第2页
第2页 / 共13页
北京市交通系统研究.docx_第3页
第3页 / 共13页
北京市交通系统研究.docx_第4页
第4页 / 共13页
北京市交通系统研究.docx_第5页
第5页 / 共13页
点击查看更多>>
下载资源
资源描述

北京市交通系统研究.docx

《北京市交通系统研究.docx》由会员分享,可在线阅读,更多相关《北京市交通系统研究.docx(13页珍藏版)》请在冰豆网上搜索。

北京市交通系统研究.docx

北京市交通系统研究

北京市交通系统研究

(小组成员:

李实振,窦水海,冯运卿,汪凯宁)

摘要:

城市交通规划部门在设置城市道路里程要考虑多种多样的因素。

城市道路里程的设置不仅要从它的必要性上考虑,而且还要从他的经济性的考虑;如果城市道路里程过长,就会造成浪费;如果城市道路里程设置过短,又会满足不了城市交通主体的需求,造成城市交通拥挤、交通阻塞,严重过影响人们的出行,造成巨大的社会资源浪费,从而与“和谐社会”的口号相悖,影响全面建设小康社会的进程。

本文是在北京市关于交通的20年的数据的基础上运用回归分析,分析了北京市GDP、公路里程、公路旅客周转量、轨道交通里程之间的关系,从而为北京市城市交通部门在城市道路里程设计方面提供参考。

关键字:

公路里程;回归分析;散点图

1问题提出

众所周知,城市交通部门在城市交通道路里程设置必须从必要性和可能性两方面考虑,同时在公路里程的设置时也要考虑多种因素,发现影响哪种因素最影响城市交通道路里程的设置。

北京市城市公路交通从1989年的9218公里到2008年的20340公里,城市公路里程在20年中有了很大的变化(图1-1),但是北京市交通部门如何更好的设置城市道路里程,将对人们的出行的发展和北京市整体的发展造成很大的影响。

 

图1-1北京市公路里程图

2回归分析的模型介绍

在许多实际问题中,影响因变量的因素往往有多个,这种一个因变量同多个自变量的回归问题就是多元回归,当因变量同各自变量之间为线性关系时,称为多元线性回归。

多元线性回归可以利用已有的观测值来对未来的指标进行预测,这种预测是基于自变量的当前观测值。

多元线性回归分析的原理同一元线性回归基本相同,但计算上要复杂得多,因此需要借助计算机来完成。

2.1多元回归模型和回归方程

设因变量为y,p个变量分别为x1,x2,……xp,描述因变量y如何依赖于自变量x1,x2,……xp和误差项ε的方程一般形式可写为:

y=β0+β1x1+β2x2+……+βpxp+ε

其中β0,β1,……,βp是未知参数,ε是随机误差项,反映了除x1,x2,……xp对y的线性关系之外的随机因素对y的影响,是不能由x1,x2,……xp与y之间的线性关系所解释的变异性。

通常地,在作显著性检验等许多情况下,我们对误差项作如下假定:

且相互独立

这种假定意味着,对于自变量的一组特定值,误差项与任意一组其他值所对应的误差项不相关,且对应的因变量y也是一个服从正态分布的随机变量。

利用样本统计量

来估计回归方程中的参数

时,得到估计的多元回归方程:

而对与参数的估计则利用最小二乘法求得,即使得残差平方和:

最小。

参数的最小二乘估计量为:

为估计参数和观测值的矩阵表示,

的转置阵。

可以证明,在符合误差项ε的假定下,最小二乘估计量

具有无偏性和有效性。

2.2回归方程的拟合优度、显著性检验与参数估计

我们定义:

总平方和

     回归平方和

     残差平方和

     多重判定系数

     修正多重判定系数

估计标准误差

     线性关系检验统计量

     回归系数

抽样分布标准差

     回归系数检验统计量

     Beta系数

     弹性系数

其中

表示实际的观测y值,

表示利用回归方程预测的y值,

表示观测值的均值,p为自变量x的个数。

多重判定系数R2的含义是:

因变量y取值的变差中,能被估计的多元回归方程所解释的比例,R2越大,说明估计的多元线性回归方程对观测值的拟合程度越好;

R2的平方根称为多重相关系数或复相关系数,反映了因变量与p个自变量之间的复合相关程度;

线性关系检验表明了因变量y与p个自变量之间的线性关系是否显著,是对线性方程总体的检验;

回归系数检验表明了单个自变量对于因变量的关系是否显著;Beta系数表示自变量变化一个标准差时,因变量y变化多少个标准差;弹性系数表示在变量平均值周围,自变量每变动1%,将使因变量变动几%,该系数与因变量的计量单位无关,适宜进行对回归模型中各变量相对重要性的比较。

2.3多重共线性和及处理

当回归模型中两个或两个以上的自变量彼此相关时,就认为存在多重共线性。

这样可能会使回归的结果混乱,甚至可能将分析引入歧途,其次,多重共线性有可能对参数估计值的正负号产生影响。

例如:

当回归方程整体的F检验很显著时却发现自变量参数估计值的t检验却只有少数几个通过了检验。

这种结果是因为,因变量与多个自变量中的某一个或几个的线性关系是显著的,但一些自变量之间还存在不独立的线性关系。

事实上,很可能每个自变量对因变量的预测都有贡献,只不过一些自变量的贡献与另一些自变量的贡献重叠。

检测多重贡献性的方法:

计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验。

如果某两个自变量的相关性显著,则说明存在多重共线性问题。

多重共线性的处理:

常用自变量选择的方法,即通过剔除自变量或增加自变量以使得回归方程中所最后保留的的自变量尽可能不相关。

自变量选择通常有以下准则:

平均残差平方和法。

从存在多重共线性的回归方程中选择几个自变量重新进行多元线性回归分析,得到的新的回归方程中平均残差平方和最小,则所选自变量的回归方程越好。

残差平方和=SSE/(n-p-1)。

根据修正的全相关系数判定。

修正的全相关系数为修正相关系数的平方根。

进行逐步回归。

思路如下:

检验每个自变量与因变量的相关性,按照相关性从大到小逐个将自变量进行筛选,每次选择一个进入自变量时要对模型整体再次进行参数的t检验,将没有通过检验的自变量剔除。

最后直到没有可以进入的变量和可以剔除的变量为止。

2.4利用回归方程进行估计和预测

点估计:

点估计值

只需要将样本值向量X0代入回归方程即可求出。

区间估计:

要求得

的区间估计,需要求得

的分布。

在误差项服从正态分布的假设下,

也服从正态分布:

当误差项方差

未知时用SSE/(n-p-1)代替,得到区间估计(显著水平α)为:

3.回归分析法在北京市道路里程设置中的应用

3.1数据和参数定义

本文采用的数据来自2008年北京市统计局统计年鉴,包括1989年到2008年的常住人口、国民生产总值GDP、公路里程、民用汽车拥有量、轨道交通里程、公路交通旅客周转量等6个指标,其中定义自变量常住人口为X1,国民生产总值GDP为X2,民用汽车拥有量X3,轨道交通里程X4,公路交通旅客周转量X5,因变量为公路里程Y。

3.2各个指标的相关性分析

散点图是表示两个变量之间的关系图,又称相关图,用于分析两个变量之间的相关关系,它具有直观简单的优点。

通过作散点图可对数据的相关性进行直观检查,不但可以得出定性的结论,而且可以通过观察剔除异常数据,从而提高对相关程度计算的准确性,对于多个变量,我们可以利用矩阵散点图来分析多个变量之间的相关关系,下面我们就用矩阵散点图来说明北京市常住人口、国民生产总值GDP、公路里程、民用汽车拥有量、轨道交通里程、公路交通旅客周转量六者之间的关系。

通过3-2矩阵散点图分析可得上述各个因素之间存在相关关系,其中民用汽车拥有量和国民生产总值存在线性的相关关系,其次就是国民生产总值和常住人口,再此之就是国民生产总值和公路里程之间具有相关关系。

这从而也可以说明公路里程的设置要从上述因素之间考虑。

表3-1北京市交通数据

年份

常住人口(万人)

GDP(亿元)

公路里程(公里)

民用汽车拥有量(万辆)

轨道交通里程(公里)

公路旅客周转量(万人公里)

1989

1075

456

9218

247503

40.1

122435

1990

1086

500.8

9648

270655

40.1

132350

1991

1094

598.9

10259

296985

40

139041

1992

1102

709.1

10827

341015

41.6

161735

1993

1112

886.2

11242

416047

41.6

127461

1994

1125

1145.3

11532

481279

41.6

180030

1995

1251.1

1507.7

11811

589408

41.6

234540

1996

1259.4

1789.2

12084

621847

41.6

250488

1997

1240

2075.6

12306

784302

41.6

261204

1998

1245.6

2376

12498

898473

41.6

304592

1999

1257.2

2677.6

12825

951388

53.7

400597

2000

1363.6

3161

13597

1041159

54

527645

2001

1385.1

3710.5

13891

1144734

54

529776

2002

1423.2

4330.4

14359

1339345

75

603510

2003

1456.4

5023.8

14453

1630704

114

693100

2004

1492.7

6060.3

14630

1871306

114

1582441

2005

1538

6886.3

14696

2145772

114

1873754

2006

1581

7861

20503

2441359

114

791947

2007

1633

9353.3

20754

2777869

142

1474249

2008

1695

10488

20340

3180798

200

2409604

图3-1散点图

3.3模型回归分析

根据上述定义常住人口为X1,国民生产总值GDP为X2,民用汽车拥有量X3,轨道交通里程X4,公路交通旅客周转量X5,因变量为公路里程Y,运用软件spss运算运行以下命令:

GETDATA

/TYPE=XLS

/FILE='C:

\DocumentsandSettings\Administrator\桌面\多元统计分析\城市交通系统.xls'

/SHEET=name'Sheet1'

/CELLRANGE=full

/READNAMES=on

/ASSUMEDSTRWIDTH=32767.

REGRESSION

/MISSINGLISTWISE

/STATISTICSCOEFFOUTSRANOVA

/CRITERIA=PIN(.05)POUT(.10)

/NOORIGIN

/DEPENDENT公路里程Y(公里)

/METHOD=ENTER常住人口X1(万人)GDPX2(亿元)民用汽车拥有量X3(万辆)轨道交通里程X4(公里)公路旅客周转量X5(万人公里

可得到以下结果

从输出结果看,回归分析结果分为四部分:

第一部分,模型中自变量情况的说明,显然本回归模型中采用的是指定变量法,模型中有自变量五个:

X1,X2,X3,X4,X5。

第二部分,模型的总结部分。

此部分给出了两变量间的相关系数R,回归模型的决定系数,并给出标准误。

从分析结果看,模型调整后的决定系数为0.971,大于0.8,说明回归模型可解释数据变动97.1%,表明模型对数据的拟合程度是较高的。

第三部分,模型的方差分析表。

此部分是对回归模型整体的显著性进行的检验,用F检验。

对应的原假设为:

回归模型是不显著的。

备择假设为:

回归模型是显著的。

可通过p值进行检验,由于F后的sig为0.000,小于0.05,因而应拒绝原假设,可认为该回归模型是显著的,即回归模型通过了F检验。

第四部分,模型的系数部分,该部分给出了回归模型的的参数估计及相关t检验内容。

从输出结果中可看出,第一列给出了五个系数的估计值,b0=15035.840,b1=—4.775,b2=1.895,b3=—0.001,b4=—12.387,b5=—0.003.,于是我们可以得出回归方程:

从上述回归方程中,截距代表当自变量为0时,北京市公路里程取值为15035.840,

但是,在回归系数的

检验中,

值均大于

,这说明这些变量对因变量的解释能力不显著。

因此,我们需要应用逐步回归方法,进行自变量的选择。

3.4模型的逐步回归分析

对模型进行逐步回归分析,得到如下结果:

从以上的结果可以发现:

在逐步回归过程中,自变量

(GDP)、

(公路旅客周转量)被选入模型并保留在模型中,而自变量

(常住人口)、

(民用汽车拥有量)、

(轨道交通里程)被排除在外。

最终建立的线性回归模型为:

经检验,此线性回归模型的各项检验通过,显著性强,可用此模型进行预测。

4.模型的现实意义

在本文的城市公路交通系统研究中我们把公路里程作为交通供给,而把公路旅客周转量作为客运交通的需求。

而交通供给和需求的动态平衡建立在城市规模的基础上,我们以城市常住人口量和GDP作为城市规模的衡量变量。

民用汽车作为城市公路交通中最为重要的客运手段,是交通系统的基础——城市规模与交通系统的供需之间作用的载体,轨道交通是重要的分散公路交通压力的手段,而且其分散作用主要集中在客运量上,我们通过研究这些变量的关系,制订一个初步的城市与交通系统之间的关系模型。

通过回归得到的方程,我们可以得到以下结论:

1.GDP——GDP和公路里程满足正相关的关系,也就是说和交通投入成正相关关系。

这是很有道理的。

因为GPD增加了,国家和我们的交通管理部门必然会加大对交通建设的投资力度,公路里程也会随之提高。

同时,这也反映了我们目前交通系统的建设的目标是指向经济规模与经济效益的——对交通建设投资的增加,会提高我们城市交通系统的运行效率,会反过来促进GDP的增加。

2.公路旅客周转量——和公路里程之间是满足一种负的相关关系的。

这和我们第一印象里公路里程和公路旅客周转量之间应该满足一种正的线性关系相反的。

但是,通过我们的数据得出,他们就是一种负相关关系。

这是为什么呢?

我认为国家和交通部门提高公路里程的目的有两个,一个是为了通过增强我们的交通系统的效率来提高我们的经济效益,一个是满足人们的出行需求。

通过数据,我们知道,交通部门把重点放在了经济效益方向上,比方说货运量在城市交通中占了很大一部分比率,而满足客运需求这方面只是占了一小部分。

这和我们目前“和谐交通”中以人为本的理念是向悖逆的。

所以说,我们国家和交通部门应该把重点放在客运需求这一方面,加大满足客运需求的力度,使城市交通更好地为民众出行服务。

3.影响公路里程的主要因素中没有常住人口和本地民用汽车拥有量,一方面是因为常住人口和民用汽车拥有量以及GDP都有线性相关关系,所以为避免多重共线性对回归结果的影响,我们在逐步回归的时候把这两个变量剔除了。

从现实意义上,这也说明了,我们目前交通系统的主要服务对象是出入城市的交通参与者。

4.轨道交通是城市交通客流的重要载体,会对公路客运量产生显著的分散效用,但通过我们的数据分析得出,轨道交通和公路交通不存在一个直接的相关关系,这说明我们对轨道交通的投入力度还不够,我们的轨道交通系统还不够成熟,他的发展变化不会造成对公路客运的一个影响,不能对我们的城市客运起到客运分流的一个辅助作用。

所以,我们目前应该增强对轨道交通的规划,实现对公路客运的一个合理分流的辅助作用。

 

参考文献:

[1]王继峰,陆化普.城市交通系统的SD模型及应用[J].交通运输系统工程与信息,2008,8(3).

[2]杨东峰,王静文,殷成志.我国大城市空间增长基本动力的实证研究[J].中国人口资源与环境,2008,18(5).

[3]杨东峰,熊国平.我国大城市空间增长机制的实证研究及政策建议[J].城市规划学刊,2008,1(7).

[4]李卫东.应用多元统计分析[M].北京:

北京大学出版社,2008.

[5]李庆华.计量经济学[M].北京:

中国经济出板社,2005.

[6]张文彤.SPSS统计分析高级教程[M].北京:

高等教育出版社,2004.

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 总结汇报

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1