最新第7章 3曲线拟合讲义复习课程.docx
《最新第7章 3曲线拟合讲义复习课程.docx》由会员分享,可在线阅读,更多相关《最新第7章 3曲线拟合讲义复习课程.docx(7页珍藏版)》请在冰豆网上搜索。
最新第7章3曲线拟合讲义复习课程
7.3曲线估计
曲线估计即曲线拟合,恰当的曲线拟合方法可以准确而快速地反映出实际情况。
在曲线估计中,一般首先绘制自变量和因变量间的散点图,然后通过数据在散点图中的分布特点选择所要进行回归分析的类型。
确定函数关系后再进一步确定函数关系中的未知参数,并进行显著性检验。
曲线估计可以拟合许多常用的曲线关系,当变量之间存在可以使用这些曲线描述的关系时,我们便可以使用曲线回归分析进行拟合。
(一)曲线回归分析的基本原理
曲线回归分析的基本任务是通过两个相关变量x与y的实际观测数据建立曲线回归方程,以揭示x与y间的曲线联系的形式。
曲线回归分析最困难和首要的工作是确定因变量y与自变量x之间曲线关系的类型。
通常通过两个途径来确定:
(1)利用有关专业知识,根据已知的理论规律和实践经验。
例如,幂函数的形式能较好地表现生产函数;多项式方程能够较好地反映总成本与总产量之间的关系等;
(2)若没有已知的理论规律和经验可利用,可在直角坐标系作散点图,观察实测点的分布趋势与哪一类已知函数曲线最接近,然后再选用该函数关系式来拟合数据。
对于可直线化的曲线函数类型,曲线回归分析的基本过程是:
先将x和(或)y进行变量转换,然后对新变量进行直线回归分析——建立直线回归方程并进行显著性检验,最后将新变量还原为原变量,由新变量的直线回归方程得出原变量的曲线回归方程。
还有一情况是找不到已知的函数曲线较接近数据的分布趋势,这时可利用多项式回归,通过逐渐增加多项式的高次项来拟合,直到满意为止。
在实际问题中,用户往往不能确定究竟该选择何种函数模型更接近样本数据,这时可以采用曲线估计的方法,其步骤如下:
1.根据实际问题本身特点,同时选择几种模型;
2.SPSS自动完成模型的参数估计,并显示R2、F检验值、相伴概率值等统计量;
3.选择具有R2统计量值最大的模型作为此问题的回归模型,并作一些预测。
(二)曲线回归模型
SPSS中的本质线性模型有:
模型
回归方程
变换后的线性方程
一元曲线(linear)
二次曲线(Quadratic)
复合曲线(Compound)
增长曲线(Growth)
对数曲线(Logarithmic)
三次曲线(Cubic)
S曲线(S)
指数曲线(Exponential)
逆函数(Inverse)
幂函数(Power)
逻辑函数(Logistic)
SPSS曲线估计中,首先,在不能明确究竟哪种模型更接近样本数据时,可在以上多种可选择的模型中,选择几种模型;然后由SPSS自动完成模型的参数估计,并输出回归方程的显著性检验F值和P值(Sig),判定系数等统计量。
最后对模型进行取舍,选取最优的模型,并进行预测分析。
(三)选择最优化模型的标准:
(1)分析各模型的F检验值,看各方程是否达到显著或极显著,剔除那些不显著的模型;
(2)对表现为显著或极显著的模型,检查模型系数的t检验值,不显著的也予以剔除;
(3)再列表比较模型的决定系数R2值大小,R2值越大的,表示经该代换后,曲线关系越密切;
(4)选取R2值最大的模型作为最优化模型。
在这过程中,模型的R2值与模型系数t检验的计算,可借助计算机,这样可大大减少研究者的工作量,而且增加计算结果的准确性,提高最后选择的客观性。
实例操作:
用曲线估计研究某公司10年中的收入与支出之间的关系
数据文件“公司收入与支出调查表”
Nd表示年度,x表示总收入,y表示支出单位为亿元
Step1【分析】【回归】【曲线估计】
Step2将y(支出)选入因变量中,x(收入)选入自变量中,勾选估计的曲线模型
95%的置信区间
输出结果与分析:
选取R2值最大的模型作为最优化模型。
由拟合图、表可以linear、cubic、Quadratic、compound、logistic和exponenbial几种曲线的拟合度较高。
SPSS22.0操作界面:
数据输入
Step1【分析】【回归】【曲线估计】
Step2将y(支出)选入因变量中,x(收入)选入自变量中,勾选估计的曲线模型
输出结果与分析:
选取R2值最大的模型作为最优化模型。
因此选择立方模型。
输出结果与分析:
由拟合图、表可以看出二次项、立方的拟合程度最高,其次是复合、增长、指数分布、对数几种曲线的拟合度较高。