1、教育1138762422884621160832516978718701261480384112832717404511767282218420872291354811772301446710105353115942912195322317412313332378011149753425410122137135148611319800361688214114173724170152026338159901613231392633017128844017949181324541256851913677422783720159654318838211236644174832221351451920
2、723138394619346二模型假设(1)薪金自然随着资历(年)的增长而增加;(2)管理人员的薪金应高于非管理人员;(3)教育程度越高薪金也越高;(4)管理责任、教育程度、资历诸因素之间没有交互作用;(5)资历(年)、管理水平、教育程度分别对薪金的影响是线性的;(6)目前公司软件开发人员的薪金是合理的;(7)在模型改进中我们假设资历(年) 、管理水平、教育程度之间存在交互作 用 。三问题的分析 对于问题,在符合题意并且与实际情况较吻合的情况下,薪金记作,资历(年)记作,为了表示是否非管理人员,定义 为了表示3种教育程度,定义 , 这样,中学用=1,=0来表示,大学用=0,=1表示,研究生则
3、用=0,=0表示。 对于影响变量的这些定性因素(管理,教育),在模型求解过程中我们采用“0-1”变量来处理,并运用数学软件matlab来求解,最后对所得的解进行讨论和分析。四模型的建立与求解1.符号的说明:管理责任,教育程度带估计的回归系数(i=1,2,3,4,5,6)随机误差随机误差, 回归系数的样本估计值回归系数的估计值的置信区间残差向量R的置信区间回归模型的检验统计量回归方程的决定系数统计量值对应的概率值剩余方差置信水平0.052.模型的建立 薪金与资历,管理责任,教育程度,之间的多元线性回归方程为:3.模型的求解直接利用matlab统计工具箱中的命令regress求解,使用格式为:b,
4、bint,r,rint,stats=regress(y,x,slpha)其中输入y为模型(1)中的y的数据(n维向量,n=30),x为对应于回归系数的数据矩阵,alpha为置信区间;输出b为的估计值,bint为b的置信区间,r为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有四个值,第1个是回归方程的决定系数(是相关系数),第2个是统计量值,第3个是与统计量值对应的概率值,第4个是剩余方差。 根据上述方程式,我们用数学软件matlab对模型进行求解 可以得到回归系数与其置信区间(置信水平=0.05),检验统计量,的结果,见表二。表二 模型(1)的计算结果参数参数估计值参数
5、置信区间1103210258,11807546484,60868836248,7517-2994-3826,-2162148-636,931 =0.579 =226 0.0001 =1.057x106五.结果分析和检验一结果分析 从表二知=0.975,即因变量(薪金)的95.7%可由模型确定,值远远超过的检验的临界值,远小于,因而模型(1)从整体来看是可用的。比如,利用模型可以估计(或预测)一个大学毕业,有2年资历,费管理人员的薪金为: =12272 模型中各个回归系数的含义可初步解释如下:的系数为546,说明资历增加1年薪金增长546 ;的系数为6883,说明管理人员薪金多6883 ;的系数
6、为-2994,说明中学程度薪金比更高的少2994 ;的系数为148,说明大学程度薪金比更高的多148 ,但是注意到置信区间包含零点,说明这个系数的解释不可靠。需要指出,以上解释是就平均值来说,并且,一个因素改变引起的因变量的变化量,都是在其他因素不变的条件下成立的。二结果检验 的置信区间包含零点,说明基本模型(1)存在缺点。为了寻找改进的方向,常用残差分析方法(残差指薪金的实际值与用模型估计的薪金y1之差,是模型(1)中随机误差的估计值,这里用了一个符号)。我们将影响因素分成资历与管理-教育组合两类,管理-教育组合的定义如表三:表三 管理教育组合 为了对残差进行分析,图1给出了与资历的关系,图
7、2给出与管理-教育,组合间的关系。 图1 模型(1)与的关系 图2模型(1)与,组合 的关系 从图一看,残差大概分成3个水平,这是由于6种管理教育组合混合在一起,在模型中未被正确反映的结果,、;从图2看,对于前4个管理教育组合,残差或者全为正,或者全为负,也表明管理教育组合在模型中处理不当。 在模型(1)中国管理责任和教育程度是分别起作用的,事实上,二者可能起着交互作用,如大学程度的管理人员的薪金会比二者分别的薪金制和高一点。以上分析提醒我们,应在基本模型(1)中增加管理与教育,的交互项,建立新的回归模型。六优化方向 通过以上分析,我们在模型一中增加管理与教育,的交互项,建立新的回归模型。模型
8、记作:利用matlab的统计工具得到的结果如表四:表四 模型(2)的计算结果1120411044,11363497486,50870486841,7255-1727-1939,7255-348-545,-152-3071-3372,-276918361571,2101 =0.9988 =5545 0.0001 =3.0047x104 由表四可知,模型(2)的和值都比模型(1)有所改进,并且所有回归系数的置信区间都不含零点,表明模型(2)是完全可用的。 与模型(1)类似,作模型(2)的两个残差分析图(图3,图4),可以看出,已经消除了图1,图2中的不正常现象,这也说明了模型(2)的适用性。图3
9、模型(2)与的关系 图4 模型(2)与, 组合的关系从图3,图4还可以发现一个异常点:具有10年资历、大学程度的管理人员(从表1可以查出是33号),他的实际薪金明显地低与模型的估计值,也明显低于与他有类似经历的其他人的薪金。这可能是由我们未知的原因造成的,为了使个别的数据不致影响整个模型,应该讲这个异常数据去掉,对模型(2)重新估计回归系数,得到的结果如表五,残差分析图见图5,图6.可以看出,去掉异常数据后结果又有改善。表五 模型(2)去掉异常数据后的计算结果1120011139,11261498494,50370416962,7120-1737-1818,-1656-356-431,-281-3056-3171,-294219971894,2100 =0.9998 =36701 0.0001 =4.347x103 图5 模型(2)去掉异常数据后 图6 模型(2)去掉异常数据后与 与的关系 与, 组合的关系 对于回归模型(2),用去掉模型异常数据(33号)后估计出的系数,得到的结果是满意的。作为这个模型的应用之一,不妨用它来制订”6种管理教育组合人员的“基础”薪金(即资历为零的薪金,当然,这也是平均意义上的)。
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1