交通数据分析与计算机技术应用提纲.docx

上传人:b****5 文档编号:7658308 上传时间:2023-01-25 格式:DOCX 页数:18 大小:110.08KB
下载 相关 举报
交通数据分析与计算机技术应用提纲.docx_第1页
第1页 / 共18页
交通数据分析与计算机技术应用提纲.docx_第2页
第2页 / 共18页
交通数据分析与计算机技术应用提纲.docx_第3页
第3页 / 共18页
交通数据分析与计算机技术应用提纲.docx_第4页
第4页 / 共18页
交通数据分析与计算机技术应用提纲.docx_第5页
第5页 / 共18页
点击查看更多>>
下载资源
资源描述

交通数据分析与计算机技术应用提纲.docx

《交通数据分析与计算机技术应用提纲.docx》由会员分享,可在线阅读,更多相关《交通数据分析与计算机技术应用提纲.docx(18页珍藏版)》请在冰豆网上搜索。

交通数据分析与计算机技术应用提纲.docx

交通数据分析与计算机技术应用提纲

交通工程数据分析

与科学计算

第一部分基础篇

数据分析基础

2-8章中的例子都从交通工程中来。

第1章绪论

第2章统计学基本概念

2.1基本概念

2.2数据的收集与抽样

第3章描述性统计分析

一维总体的数字特征

频数和频率

均值比较分析

数据变换

参数的假设检验和区间估计

检验功效

样本容量计算

方差分析

第4章统计推断和假设检验

点估计

区间估计

假设检验

卡方检验

T检验

总体的推断

 

第5章相关和回归分析

基本概念

一元线性回归→参数回归、拟合优度检验

多元线性回归

建模

多项式回归

可化为线形回归的曲线回归

逐步回归

Logistic回归

非线性回归

5.1相关分析与回归分析基本概念

5.2相关分析

5.3一元线性回归

5.3.1.1一元线性回归的定义

5.3.1.2一元线性回归模型的确定

 

5.3.1.3案例(交通工程中的应用)

 

5.4多元线性回归

一元线性回归是讨论的两个变量因素之间的回归问题,然而客观世界的变化往往受多种因素的影响,即使其中一个因素起着主导作用,但有时其它因素的作用也不可忽视。

在实际问题中,大多数影响自变量的因素不是一个,而是多个。

我们把包括两个或两个以上自变量的回归成为多元回归。

本节中,我们首先以两个自变量的模型为例说明多元回归的使用,然后推广到三个或三个以上自变量的多元回归模型。

5.4.1.1多元线性回归的定义

一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。

当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。

设y为因变量,

为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:

其中,b0为常数项,

为回归系数,b1为

固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为

固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。

如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:

其中,b0为常数项,

为回归系数,b1为

固定时,x2每增加一个单位对y的效应,即x2对y的偏回归系数,等等。

如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:

y=b0+b1x1+b2x2+e

建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:

(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;

(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;

(3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;

(4)自变量应具有完整的统计数据,其预测值容易确定。

多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(

)为最小的前提下,用最小二乘法求解参数。

以二线性回归模型为例,求解回归参数的标准方程组为

解此方程可求得b0,b1,b2的数值。

亦可用下列矩阵法求得

5.4.1.2多元线性回归模型的检验

多元性回归模型与一元线性回归模型一样,在得到参数的最小二乘法的估计值之后,也需要进行必要的检验与评价,以决定模型是否可以应用。

1、拟合程度的测定。

与一元线性回归中可决系数r2相对应,多元线性回归中也有多重可决系数r2,它是在因变量的总变化中,由回归方程解释的变动(回归平方和)所占的比重,R2越大,回归方各对样本数据点拟合的程度越强,所有自变量与因变量的关系越密切。

计算公式为:

其中,

2.估计标准误差

估计标准误差,即因变量y的实际值与回归方程求出的估计值

之间的标准误差,估计标准误差越小,回归方程拟合程度越程。

其中,k为多元线性回归方程中的自变量的个数。

3.回归方程的显著性检验

回归方程的显著性检验,即检验整个回归方程的显著性,或者说评价所有自变量与因变量的线性关系是否密切。

能常采用F检验,F统计量的计算公式为:

根据给定的显著水平a,自由度(k,n-k-1)查F分布表,得到相应的临界值Fa,若F>Fa,则回归方程具有显著意义,回归效果显著;F

4.回归系数的显著性检验

在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。

t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。

检验时先计算统计量ti;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值ta或ta/2,t>t−a或ta/2,则回归系数bi与0有显著关异,反之,则与0无显著差异。

统计量t的计算公式为:

其中,Cij是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)−1的主对角线上的第j个元素。

对二元线性回归而言,可用下列公式计算:

其中,

5.多重共线性判别

若某个回归系数的t检验通不过,可能是这个系数相对应的自变量对因变量的影平不显著所致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。

也可能是自变量之间有共线性所致,此时应设法降低共线性的影响。

多重共线性是指在多元线性回归方程中,自变量之彰有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。

需要指出的是,在多元回归模型中,多重共线性的难以避免的,只要多重共线性不太严重就行了。

判别多元线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数r2,若r2>R2或接近于R2,则应设法降低多重线性的影响。

亦可计算自变量间的相关系数矩阵的特征值的条件数k=λ1/λp(λ1为最大特征值,λp为最小特征值),k<100,则不存在多重点共线性;若100≤k≤1000,则自变量间存在较强的多重共线性,若k>1000,则自变量间存在严重的多重共线性。

降低多重共线性的办法主要是转换自变量的取值,如变绝对数为相对数或平均数,或者更换其他的自变量。

6.D.W检验

当回归模型是根据动态数据建立的,则误差项e也是一个时间序列,若误差序列诸项之间相互独立,则误差序列各项之间没有相关关系,若误差序列之间存在密切的相关关系,则建立的回归模型就不能表述自变量与因变量之间的真实变动关系。

D.W检验就是误差序列的自相关检验。

检验的方法与一元线性回归相同。

5.4.1.3操作方法

用Excel进行操作

用SPSS

5.4.1.4案例

案例一:

公路客货运输量多元线性回归预测方法探讨[2]

马进.公路客货运输量多元线性回归预测方法探讨[J].汽车运输研究.1994

(1)

一、背景

公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。

关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的具体操作。

根据笔者先后参加的部、省、市的科研课题的实践,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。

二、多元线性回归预测

线性回归分析法是以相关性原理为基础的.相关性原理是预测学中的基本原理之一。

由于公路客、货运输量受社会经济有关因素的综合影响。

所以,多元线性回归预测首先是建立公路客、货运输量与其有关影响因素之间线性关系的数学模型。

然后通过对各影响因素未来值的预测推算出公路客货运输量的预测值。

三、公路客、货运输量多元线性回归预测方法的实施步骤

1.影响因素的确定

影响公路客货运输量的因素很多,主要包括以下一些因素:

(1)客运量影响因素

人口增长量裤保有量、国民生产总值、国民收入工农业总产值,基本建设投资额城乡居民储蓄额铁路和水运客运量等。

(2)货运量影响因素

人口货车保有量(包括拖拉机),国民生产总值,国民收入、工农业总产值,基本建设投资额,主要工农业产品产量,社会商品购买力,社会商品零售总额.铁路和水运货运量菩。

上述影响因素仅是对一般而言,在针对具体研究对象时会有所增减。

因此,在建立模型时只须列入重要的影响因素,对于非重要因素可不列入模型中。

若疏漏了某些重要的影响因素,则会造成预测结果的失真。

另外,影响因素太少会造成模型的敏感性太强.反之,若将非重要影响因素列入模型,则会增加计算工作量,使模型的建立复杂化并增大随机误差。

影响因素的选择是建立预测模型首要的关键环节,可采取定性和定量相结合的方法进行.影响因素的确定可以通过专家调查法,其目的是为了充分发挥专家的聪明才智和经验。

具体做法就是通过对长期从事该地区公路运输企业和运输管理部门的领导干部、专家、工作人员和行家进行调查。

可通过组织召开座谈会.也可以通过采访,填写调查表等方法进行,从中选出主要影响因素为了避免影响因素确定的随意性,提高回归模型的精度和减少预测工作量,可通过查阅有关统计资料后,再对各影响因素进行相关度(或关联度)和共线性分析,从而再次筛选出最主要的影响因素.所谓相关度分析就是将各影响因素的时间序列与公路客货运量的时间序列做相关分杯事先确定—个相关系数,对相关系数小于的影响因素进行淘汰.关联度是灰色系统理论中反映事物发展变化过程中各因素之间的关联程度,可通过建空公路客、货运量与各影响影响因素之间关联系数矩阵,按一定的标准系数舍去关联度小的影响因素.所谓共线性是指某些影响因素之问存在着线性关系或接近于线性关系.由于公路运输经济自身的特点,影响公路客,货运输量的诸多因素之问总是存在着一定的相关性,持别是与国民经济有关的一些价值型指标。

我们研究的不是有无相关性问题而是共线性的程度,如果影响因素之间的共线性程度很高,首先会降低参数估计值的精度。

其次在回归方程建立后的统计检验中导致舍去重要的影响因素或错误的地接受无显著影响的因素,从而使整个预测工作失去实际意义。

关于共线性程度的判定,可利用逐步分析估计法的数理统计理论编制计算机程序来实现。

或者通过比较rij和R2的大小来判定。

在预测学上,一般认为当rij>R2时,共线性是严重的,其含义是,多元线性回归方程中所含的任意两个自变量xi,xj之间的相关系数rij大于或等于该方程的样本可决系数R2时,说明自变量中存在着严重的共线性问题。

2.建立经验线性回归方程利用最小二乘法原理寻求使误差平方和达到撮小的经验线性回归方程:

y——预测的客、货运量

g——各主要影响因数

3.数据整理

对收集的历年客、货运输量和各主要影响因素的统计资料进行审核和加工整理是为了保证预测工作的质量。

资料整理主要包括下列内容:

(1)资料的补缺和推算。

(2)对不可靠资料加以核实调整.对查明原因的异常值加以修正。

(3)对时间序列中不可比的资料加以调整和规范化;对按当年价格计算的价值指标应折算成按统。

4.多元线性回归模型的参数估计

在经验线性回归模型中,

是要估计的参数,可通过数理统计理论建立模型来确定。

在实际预测中,可利用多元线性回归复相关分析的计算机程序来实现·5.对模型参数的估计值进行检验。

6.最优回归方程的确定

经过上述的经济意义和统计检验后,挑选出的线性回归方程往往是好几个、为了从中优选出用于进行实际预测的方程,我们可以采用定性和定量相结合的办法。

从数理统计的原理来讲,应挑选方程的剩余均方和S·E较小为好.但作为经济预'删还必须尽量考虑到方程中的影响因素更切合实际和其未来值更易把握的原则来综合考虑。

当然、有时也可以从中挑选出好几个较优的回归方程.通过预测后,分别作为不同的高、中、低方案以供决策人员选择。

7.模型的实际预测检验

在获得模型参数估计值后,又经过了上述一系列检验而选出的最优(或较优)回归方程,还必须对模型的预测能力加以检验。

不难理解、最优回归方程对于样本期间来说是正确的,但是对用于实际预测是否合适呢?

为此,还必须研究参数估计值的稳定性及相对于样本容量变化时的灵敏度,也必须研究确定估计出来的模型是否可以用于样本观察值以外的范国,其具休做法是:

(1)采用把增大样本容量以后模型估计的结果与原来的估计结果进行比较,并检验其差异的显著性。

(2)把估计出来的模型用于样本以外某一时间的实际预测,并将这个预测值与实际的观察值作一比较,然后检验其差异的显著性。

8.模型的应用

公路客、货运输量多元线性回归预测模型的研究目的主要有以下几个方面。

(1)进行结构分析,研究影响该地区的公路客、货运输量的主耍因素和各影响因素影响程度的大小,进一步探讨该地区公路运输经济理论。

(2)预测该地区今后年份的公路客、货运输量的变化,以便为公路运输市场、公路运输政策及公路运辅建设项目投资作出正确决策提供理论依据。

另外,还可以通过公路客.货运输量与公路交通量作相关分析来对公路的饱和度发展趋势进行预测。

从而为公路的新建、扩建项目的投资提供决策分析。

(3)模拟各种经济政策下的经济效果,以便对有关政策进行评价。

四、经调查分析,影响某地区旅客运输量的因素为。

x1——国民收入

x2——工农业总产值

x3——社会总产值

x4——人口

x5——客车保有量

x6——城乡居民储蓄存款

经计算得下列相关系数表:

x1

x2

x3

x4

x5

x6

Y

0.9439

0.9287

O.9043

0.9914

0.9670

0.7021

Z

0.9736

0.96l4

O.9326

O.8645

O.9321

0.6678

Y——客运盈

Z——旅客周转量

若令α=0.85,则可以舍去x6这个影响因索,也就是认为“城乡居民储蓄存款”不能作为响旅客运输量的主要因素。

2.经调查分析、影响某地区旅客运输量的因素为:

x1——国民收入

x2——工农业总产值

x3——社会总产值

x4——人口

x5——客车保有量

x6——国民生产总值

x7——公路通车里程

经计算得客运量和旅客周转量的经验线性回归方程如下:

Y=α0+α1x1+α2x2+α5x5R^2=0.9997

R^2=0.9962

Z=β0+β4x4+β5x5+β7x7R^2=0.9983

R2=0.9990

Y——客运盈

Z——旅客周转量

各自变量问的相关系数表如下:

由上述计算可知,四个方程中均未出现rij>R2的情况.因此可以认为各自方程中的影响因素之间不存在严重共线性问题。

3.经调查分析,影响某地区货运周转量的因素为:

x1——国民收入

x2——工农业总产值

x3——基建投资额

x4——原煤产量

x5——钢铁、化肥、水泥、粮食总产量

x6——国民总产值

x7——社会商品零售总额

x8——相邻地、市工农业总产值的平均值

Y=a0+a4x4+a6x6+a7x7

(1)

其中:

R2=0.9875F=206.33S·E=1673.24

t4=-2.8321t6=3.1407t7=2.7431

Y=b0+b2x2+b4x4

(2)

其中:

R2=0.9764F=164.59S·E=1044.27

5.5非线性回归

 

第6章多元统计分析(多变量分析)

主成分分析

典型相关分析

聚类分析(集群分析)

判别分析

因子分析

 

第7章方差分析和协方差分析

方差分析主要用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值的总体。

方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时是非常有用的。

我们在前边的假设检验中,已经说明过了如何检验两个总体的均值是否相等的各种情况。

方差分析的作用就是可以检验多个样本的均值是否相等。

单因子方差分析和非参数方差分析

多因子方差分析

析因设计的方差分析

协方差分析

第8章时间序列分析

定义

分类

计算方法

交通工程中的应用

 

 

第二部分理论篇

常用计算方法

 

9-11章为基本应用,

与前面内容有些交叉,但深度和侧重点不同,比如预测方法与技术中时间序列预测主要介绍如何应用时间序列法进行预测,而前面的时间序列分析法是一种通用的分析方法,不仅用于预测。

第9章预测方法和技术

说一下交通工程中为什么需要学习预测方法和技术,都在哪些方面使用

里面的举例最好都用交通工程预测的方法

9.1预测方法概述

有哪几种预测方法

分别介绍,特点,优缺点,适用性,在交通工程中的应用场合。

9.2定性预测

定性预测法概述

德尔菲法(delphi)

主观概率法

其它方法

9.3相关与回归分析

9.4时间序列分解法和趋势外推法

9.4.1时间序列分解法

9.4.2趋势外推法概述

9.4.3多项式曲线趋势外推法

9.4.4指数曲线趋势外推法

9.4.5生长曲线趋势外推法

9.4.6曲线拟合优度分析

9.5时间序列平滑预测

9.5.1平滑预测简介

9.5.2一次移动平均法和一次指数平滑法

9.5.3线性二次移动平均法

9.5.4线性二次指数平滑法

9.6弹性系数法

交通工程的预测中常用的方法

第10章决策方法和技术

10.1决策的基本概念

10.1.1决策的概念

10.1.2决策的种类

10.2风险性决策

10.3贝叶斯决策

10.4不确定型的决策

10.5多目标决策

第11章评价方法和技术

11.1综合评价概述

11.2层次分析法

11.3模糊综合评判/评价

11.4灰色综合评价

第12章试验设计与分析

试验设计与分析概述

单因素试验设计与分析

多因素试验设计与分析

正交试验设计

12.1什么是DOE试验设计

 

12.2为什么需要DOE

12.3常用的试验设计方法

 

详细叙述各种试验设计方法,计算过程,使用条件,适用场合,

 

撰写在交通工程计算中的应用

实例

 

第13章运筹学中的应用和计算

本章暂不写

第三部分应用篇

交通工程中的统计分析和科学计算

数据简单统计分析及其应用

以Excel应用为例

参考:

统计学——以Excel为分析工具,宋廷山,葛金田,北京大学出版社

 

第14章交通量数据的分析

有的计算分析不一定必须用到统计计算方法

14.1路段交通参数统计分析

14.1.1交通量的一般描述统计

处理的方法、计算等

数据的展示→图表

 

14.1.2车头时距分布

找实例。

详细分析计算

 

14.2交叉口交通量统计分析

14.2.1一般交叉口交通量数据处理与分析

1)交叉口交通调查数据处理

根据交叉口交通量流量流向调查表制作交叉口数据处理模板

内容包括:

分时段计算交通量折算值

计算调查时段的高峰小时交通量和高峰小时系数

计算进口道折算交通量和出口道折算交通量

绘制进口道各种车型比例图(饼图)

 

2)绘制全天交通量直方图或折线图

均值、方差等描述统计

应用

14.2.2环形交叉口交通量分析

解多元一次方程组

环形交叉口交通量调查

做一下介绍

环形交叉口调查的难度和存在的问题

引出调查方法

14.2.3立体交叉的交通量分析

第15章交通流速度的统计分析

15.1速度的描述性统计分析

描述统计、直方图

绘制地点车速直方图

频率分布图

累计曲线图

绘制类似下面的图

方法:

工具→数据分析→直方图

注意,接受区域中各数据为某数值区间的上限

2)

根据速度调查样本统计计算出85%车速、15%车速和中位车速(中值车速)

利用:

工具→数据分析→排位与百分比排位

3)计算平均车速

15.2车速分布分析

(正态)分布拟合和检验

15.3行程车速观测数据的处理分析

第16章交通流的检验

通过交通流的观测和统计,检验交通流的参数服从何种分布

第17章出行调查资料统计分析

居民出行调查基本概念

第18章客货流调查数据分析和计算

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1