4.回归系数的显著性检验
在一元线性回归中,回归系数显著性检验(t检验)与回归方程的显著性检验(F检验)是等价的,但在多元线性回归中,这个等价不成立。
t检验是分别检验回归模型中各个回归系数是否具有显著性,以便使模型中只保留那些对因变量有显著影响的因素。
检验时先计算统计量ti;然后根据给定的显著水平a,自由度n-k-1查t分布表,得临界值ta或ta/2,t>t−a或ta/2,则回归系数bi与0有显著关异,反之,则与0无显著差异。
统计量t的计算公式为:
其中,Cij是多元线性回归方程中求解回归系数矩阵的逆矩阵(x'x)−1的主对角线上的第j个元素。
对二元线性回归而言,可用下列公式计算:
其中,
5.多重共线性判别
若某个回归系数的t检验通不过,可能是这个系数相对应的自变量对因变量的影平不显著所致,此时,应从回归模型中剔除这个自变量,重新建立更为简单的回归模型或更换自变量。
也可能是自变量之间有共线性所致,此时应设法降低共线性的影响。
多重共线性是指在多元线性回归方程中,自变量之彰有较强的线性关系,这种关系若超过了因变量与自变量的线性关系,则回归模型的稳定性受到破坏,回归系数估计不准确。
需要指出的是,在多元回归模型中,多重共线性的难以避免的,只要多重共线性不太严重就行了。
判别多元线性回归方程是否存在严惩的多重共线性,可分别计算每两个自变量之间的可决系数r2,若r2>R2或接近于R2,则应设法降低多重线性的影响。
亦可计算自变量间的相关系数矩阵的特征值的条件数k=λ1/λp(λ1为最大特征值,λp为最小特征值),k<100,则不存在多重点共线性;若100≤k≤1000,则自变量间存在较强的多重共线性,若k>1000,则自变量间存在严重的多重共线性。
降低多重共线性的办法主要是转换自变量的取值,如变绝对数为相对数或平均数,或者更换其他的自变量。
6.D.W检验
当回归模型是根据动态数据建立的,则误差项e也是一个时间序列,若误差序列诸项之间相互独立,则误差序列各项之间没有相关关系,若误差序列之间存在密切的相关关系,则建立的回归模型就不能表述自变量与因变量之间的真实变动关系。
D.W检验就是误差序列的自相关检验。
检验的方法与一元线性回归相同。
5.4.1.3操作方法
用Excel进行操作
用SPSS
5.4.1.4案例
案例一:
公路客货运输量多元线性回归预测方法探讨[2]
马进.公路客货运输量多元线性回归预测方法探讨[J].汽车运输研究.1994
(1)
一、背景
公路客、货运输量的定量预测,近几年来在我国公路运输领域大面积广泛地开展起来,并有效的促进了公路运输经营决策的科学化和现代化。
关于公路客、货运输量的定量预测方法很多,本文主要介绍多元线性回归方法在公路客货运输量预测中的具体操作。
根据笔者先后参加的部、省、市的科研课题的实践,证明了多元线性回归方法是对公路客、货运输量预测的一种置信度较高的有效方法。
二、多元线性回归预测
线性回归分析法是以相关性原理为基础的.相关性原理是预测学中的基本原理之一。
由于公路客、货运输量受社会经济有关因素的综合影响。
所以,多元线性回归预测首先是建立公路客、货运输量与其有关影响因素之间线性关系的数学模型。
然后通过对各影响因素未来值的预测推算出公路客货运输量的预测值。
三、公路客、货运输量多元线性回归预测方法的实施步骤
1.影响因素的确定
影响公路客货运输量的因素很多,主要包括以下一些因素:
(1)客运量影响因素
人口增长量裤保有量、国民生产总值、国民收入工农业总产值,基本建设投资额城乡居民储蓄额铁路和水运客运量等。
(2)货运量影响因素
人口货车保有量(包括拖拉机),国民生产总值,国民收入、工农业总产值,基本建设投资额,主要工农业产品产量,社会商品购买力,社会商品零售总额.铁路和水运货运量菩。
上述影响因素仅是对一般而言,在针对具体研究对象时会有所增减。
因此,在建立模型时只须列入重要的影响因素,对于非重要因素可不列入模型中。
若疏漏了某些重要的影响因素,则会造成预测结果的失真。
另外,影响因素太少会造成模型的敏感性太强.反之,若将非重要影响因素列入模型,则会增加计算工作量,使模型的建立复杂化并增大随机误差。
影响因素的选择是建立预测模型首要的关键环节,可采取定性和定量相结合的方法进行.影响因素的确定可以通过专家调查法,其目的是为了充分发挥专家的聪明才智和经验。
具体做法就是通过对长期从事该地区公路运输企业和运输管理部门的领导干部、专家、工作人员和行家进行调查。
可通过组织召开座谈会.也可以通过采访,填写调查表等方法进行,从中选出主要影响因素为了避免影响因素确定的随意性,提高回归模型的精度和减少预测工作量,可通过查阅有关统计资料后,再对各影响因素进行相关度(或关联度)和共线性分析,从而再次筛选出最主要的影响因素.所谓相关度分析就是将各影响因素的时间序列与公路客货运量的时间序列做相关分杯事先确定—个相关系数,对相关系数小于的影响因素进行淘汰.关联度是灰色系统理论中反映事物发展变化过程中各因素之间的关联程度,可通过建空公路客、货运量与各影响影响因素之间关联系数矩阵,按一定的标准系数舍去关联度小的影响因素.所谓共线性是指某些影响因素之问存在着线性关系或接近于线性关系.由于公路运输经济自身的特点,影响公路客,货运输量的诸多因素之问总是存在着一定的相关性,持别是与国民经济有关的一些价值型指标。
我们研究的不是有无相关性问题而是共线性的程度,如果影响因素之间的共线性程度很高,首先会降低参数估计值的精度。
其次在回归方程建立后的统计检验中导致舍去重要的影响因素或错误的地接受无显著影响的因素,从而使整个预测工作失去实际意义。
关于共线性程度的判定,可利用逐步分析估计法的数理统计理论编制计算机程序来实现。
或者通过比较rij和R2的大小来判定。
在预测学上,一般认为当rij>R2时,共线性是严重的,其含义是,多元线性回归方程中所含的任意两个自变量xi,xj之间的相关系数rij大于或等于该方程的样本可决系数R2时,说明自变量中存在着严重的共线性问题。
2.建立经验线性回归方程利用最小二乘法原理寻求使误差平方和达到撮小的经验线性回归方程:
y——预测的客、货运量
g——各主要影响因数
3.数据整理
对收集的历年客、货运输量和各主要影响因素的统计资料进行审核和加工整理是为了保证预测工作的质量。
资料整理主要包括下列内容:
(1)资料的补缺和推算。
(2)对不可靠资料加以核实调整.对查明原因的异常值加以修正。
(3)对时间序列中不可比的资料加以调整和规范化;对按当年价格计算的价值指标应折算成按统。
4.多元线性回归模型的参数估计
在经验线性回归模型中,
是要估计的参数,可通过数理统计理论建立模型来确定。
在实际预测中,可利用多元线性回归复相关分析的计算机程序来实现·5.对模型参数的估计值进行检验。
6.最优回归方程的确定
经过上述的经济意义和统计检验后,挑选出的线性回归方程往往是好几个、为了从中优选出用于进行实际预测的方程,我们可以采用定性和定量相结合的办法。
从数理统计的原理来讲,应挑选方程的剩余均方和S·E较小为好.但作为经济预'删还必须尽量考虑到方程中的影响因素更切合实际和其未来值更易把握的原则来综合考虑。
当然、有时也可以从中挑选出好几个较优的回归方程.通过预测后,分别作为不同的高、中、低方案以供决策人员选择。
7.模型的实际预测检验
在获得模型参数估计值后,又经过了上述一系列检验而选出的最优(或较优)回归方程,还必须对模型的预测能力加以检验。
不难理解、最优回归方程对于样本期间来说是正确的,但是对用于实际预测是否合适呢?
为此,还必须研究参数估计值的稳定性及相对于样本容量变化时的灵敏度,也必须研究确定估计出来的模型是否可以用于样本观察值以外的范国,其具休做法是:
(1)采用把增大样本容量以后模型估计的结果与原来的估计结果进行比较,并检验其差异的显著性。
(2)把估计出来的模型用于样本以外某一时间的实际预测,并将这个预测值与实际的观察值作一比较,然后检验其差异的显著性。
8.模型的应用
公路客、货运输量多元线性回归预测模型的研究目的主要有以下几个方面。
(1)进行结构分析,研究影响该地区的公路客、货运输量的主耍因素和各影响因素影响程度的大小,进一步探讨该地区公路运输经济理论。
(2)预测该地区今后年份的公路客、货运输量的变化,以便为公路运输市场、公路运输政策及公路运辅建设项目投资作出正确决策提供理论依据。
另外,还可以通过公路客.货运输量与公路交通量作相关分析来对公路的饱和度发展趋势进行预测。
从而为公路的新建、扩建项目的投资提供决策分析。
(3)模拟各种经济政策下的经济效果,以便对有关政策进行评价。
四、经调查分析,影响某地区旅客运输量的因素为。
x1——国民收入
x2——工农业总产值
x3——社会总产值
x4——人口
x5——客车保有量
x6——城乡居民储蓄存款
经计算得下列相关系数表:
x1
x2
x3
x4
x5
x6
Y
0.9439
0.9287
O.9043
0.9914
0.9670
0.7021
Z
0.9736
0.96l4
O.9326
O.8645
O.9321
0.6678
Y——客运盈
Z——旅客周转量
若令α=0.85,则可以舍去x6这个影响因索,也就是认为“城乡居民储蓄存款”不能作为响旅客运输量的主要因素。
2.经调查分析、影响某地区旅客运输量的因素为:
x1——国民收入
x2——工农业总产值
x3——社会总产值
x4——人口
x5——客车保有量
x6——国民生产总值
x7——公路通车里程
经计算得客运量和旅客周转量的经验线性回归方程如下:
Y=α0+α1x1+α2x2+α5x5R^2=0.9997
R^2=0.9962
Z=β0+β4x4+β5x5+β7x7R^2=0.9983
R2=0.9990
Y——客运盈
Z——旅客周转量
各自变量问的相关系数表如下:
由上述计算可知,四个方程中均未出现rij>R2的情况.因此可以认为各自方程中的影响因素之间不存在严重共线性问题。
3.经调查分析,影响某地区货运周转量的因素为:
x1——国民收入
x2——工农业总产值
x3——基建投资额
x4——原煤产量
x5——钢铁、化肥、水泥、粮食总产量
x6——国民总产值
x7——社会商品零售总额
x8——相邻地、市工农业总产值的平均值
Y=a0+a4x4+a6x6+a7x7
(1)
其中:
R2=0.9875F=206.33S·E=1673.24
t4=-2.8321t6=3.1407t7=2.7431
Y=b0+b2x2+b4x4
(2)
其中:
R2=0.9764F=164.59S·E=1044.27
5.5非线性回归
第6章多元统计分析(多变量分析)
主成分分析
典型相关分析
聚类分析(集群分析)
判别分析
因子分析
第7章方差分析和协方差分析
方差分析主要用来检验两个以上样本的均值差异的显著程度,由此判断样本究竟是否抽自具有同一均值的总体。
方差分析对于比较不同生产工艺或设备条件下产量、质量的差异,分析不同计划方案效果的好坏和比较不同地区、不同人员有关的数量指标差异是否显著时是非常有用的。
我们在前边的假设检验中,已经说明过了如何检验两个总体的均值是否相等的各种情况。
方差分析的作用就是可以检验多个样本的均值是否相等。
单因子方差分析和非参数方差分析
多因子方差分析
析因设计的方差分析
协方差分析
第8章时间序列分析
定义
分类
计算方法
交通工程中的应用
第二部分理论篇
常用计算方法
9-11章为基本应用,
与前面内容有些交叉,但深度和侧重点不同,比如预测方法与技术中时间序列预测主要介绍如何应用时间序列法进行预测,而前面的时间序列分析法是一种通用的分析方法,不仅用于预测。
第9章预测方法和技术
说一下交通工程中为什么需要学习预测方法和技术,都在哪些方面使用
里面的举例最好都用交通工程预测的方法
9.1预测方法概述
有哪几种预测方法
分别介绍,特点,优缺点,适用性,在交通工程中的应用场合。
9.2定性预测
定性预测法概述
德尔菲法(delphi)
主观概率法
其它方法
9.3相关与回归分析
9.4时间序列分解法和趋势外推法
9.4.1时间序列分解法
9.4.2趋势外推法概述
9.4.3多项式曲线趋势外推法
9.4.4指数曲线趋势外推法
9.4.5生长曲线趋势外推法
9.4.6曲线拟合优度分析
9.5时间序列平滑预测
9.5.1平滑预测简介
9.5.2一次移动平均法和一次指数平滑法
9.5.3线性二次移动平均法
9.5.4线性二次指数平滑法
9.6弹性系数法
交通工程的预测中常用的方法
第10章决策方法和技术
10.1决策的基本概念
10.1.1决策的概念
10.1.2决策的种类
10.2风险性决策
10.3贝叶斯决策
10.4不确定型的决策
10.5多目标决策
第11章评价方法和技术
11.1综合评价概述
11.2层次分析法
11.3模糊综合评判/评价
11.4灰色综合评价
第12章试验设计与分析
试验设计与分析概述
单因素试验设计与分析
多因素试验设计与分析
正交试验设计
12.1什么是DOE试验设计
12.2为什么需要DOE
12.3常用的试验设计方法
详细叙述各种试验设计方法,计算过程,使用条件,适用场合,
撰写在交通工程计算中的应用
实例
第13章运筹学中的应用和计算
本章暂不写
第三部分应用篇
交通工程中的统计分析和科学计算
数据简单统计分析及其应用
以Excel应用为例
参考:
统计学——以Excel为分析工具,宋廷山,葛金田,北京大学出版社
第14章交通量数据的分析
有的计算分析不一定必须用到统计计算方法
14.1路段交通参数统计分析
14.1.1交通量的一般描述统计
处理的方法、计算等
数据的展示→图表
14.1.2车头时距分布
找实例。
详细分析计算
14.2交叉口交通量统计分析
14.2.1一般交叉口交通量数据处理与分析
1)交叉口交通调查数据处理
根据交叉口交通量流量流向调查表制作交叉口数据处理模板
内容包括:
分时段计算交通量折算值
计算调查时段的高峰小时交通量和高峰小时系数
计算进口道折算交通量和出口道折算交通量
绘制进口道各种车型比例图(饼图)
2)绘制全天交通量直方图或折线图
均值、方差等描述统计
应用
14.2.2环形交叉口交通量分析
解多元一次方程组
环形交叉口交通量调查
做一下介绍
环形交叉口调查的难度和存在的问题
引出调查方法
14.2.3立体交叉的交通量分析
第15章交通流速度的统计分析
15.1速度的描述性统计分析
描述统计、直方图
绘制地点车速直方图
频率分布图
累计曲线图
绘制类似下面的图
方法:
工具→数据分析→直方图
注意,接受区域中各数据为某数值区间的上限
2)
根据速度调查样本统计计算出85%车速、15%车速和中位车速(中值车速)
利用:
工具→数据分析→排位与百分比排位
3)计算平均车速
15.2车速分布分析
(正态)分布拟合和检验
15.3行程车速观测数据的处理分析
第16章交通流的检验
通过交通流的观测和统计,检验交通流的参数服从何种分布
第17章出行调查资料统计分析
居民出行调查基本概念
第18章客货流调查数据分析和计算