软件开发人员的薪金.docx

上传人:b****1 文档编号:1762664 上传时间:2022-10-23 格式:DOCX 页数:15 大小:68.31KB
下载 相关 举报
软件开发人员的薪金.docx_第1页
第1页 / 共15页
软件开发人员的薪金.docx_第2页
第2页 / 共15页
软件开发人员的薪金.docx_第3页
第3页 / 共15页
软件开发人员的薪金.docx_第4页
第4页 / 共15页
软件开发人员的薪金.docx_第5页
第5页 / 共15页
点击查看更多>>
下载资源
资源描述

软件开发人员的薪金.docx

《软件开发人员的薪金.docx》由会员分享,可在线阅读,更多相关《软件开发人员的薪金.docx(15页珍藏版)》请在冰豆网上搜索。

软件开发人员的薪金.docx

软件开发人员的薪金

软件开发人员的薪金

摘要

本文所要解决的是研究软件开发人员的薪金与他们的资历、管理责任、教育程度等之间的关系,建立一个模型,以便分析公司人事策略的合理性,并作为新聘人员薪金的考虑。

根据题设条件,结合实际情况,建立线性回归模型,方程表达式:

其中,,,,是回归系数,ε为随机误差,,,,分别为资历、管理水平和教育程度。

结合题目所给的数据,运用matlab软件的命令rearess,求出了软件开发人员的薪金与资历、管理水平、教育水平之间的线性回归方程:

分析后同时运用残差分析法发现模型的缺陷,改进影响软件开发人员薪金的因素,改变模型,使得管理责任因素和教育程度因素对薪金是交互作用的,这样合理化模型后,得出了影响软件开发人员薪金因素的最佳多元回归模型。

建立回归方程:

并用运用matlab软件得出了该模型的较准确的解:

并对回归方程和各个因素运用残差分析法进行了显著性检验,去掉异常数据后,在运用matlab软件求解,得出更为准确的解:

再次运用残差分析法对模型进行检验,说明模型可用。

综上所述,本文对数据进行深入分析,运用MATLAB软件画图,制作表格,更形象地反映数据,简单明了,运用残差分析法对模型进行检验,说明模型可用。

 

关键字:

线性回归模型ressess残差分析法

 

一.问题重述

一家高技术公司人事部门为研究软件开发人员的薪金与他们的资历、管理责任、教育程度等之间的关系,要建立一个模型,以便分析公司人事策略的合理性,并作为新聘用人员薪金的参考。

他们认为目前公司人员的薪金总体上是合理的,可以作为建模的依据,于是调查了46名软件开发人员的档案资料,如表,其中资历一列指从事专业工作的年数,管理一列中1表示管理人员,0表示非管理人员,教育一列中1表示中学程度,2表示大学程度,3表示更高程度(研究生)。

表一软件开发人员的薪金与他们的资历、管理责任、教育程度之间的关系

编号

薪金

资历

管理

教育

编号

薪金

资历

管理

教育

1

13876

1

1

1

24

22884

6

1

2

2

11608

1

0

3

25

16978

7

1

1

3

18701

1

1

3

26

14803

8

0

2

4

11283

1

0

2

27

17404

8

1

1

5

11767

1

0

3

28

22184

8

1

3

6

20872

2

1

2

29

13548

8

0

1

7

11772

2

0

2

30

14467

10

0

1

8

10535

2

0

1

31

15942

10

0

2

9

12195

2

0

3

32

23174

10

1

3

10

12313

3

0

2

33

23780

10

1

2

11

14975

3

1

1

34

25410

11

1

2

12

21371

3

1

2

35

14861

11

0

1

13

19800

3

1

3

36

16882

12

0

2

14

11417

4

0

1

37

24170

12

1

3

15

20263

4

1

3

38

15990

13

0

1

16

13231

4

0

3

39

26330

13

1

2

17

12884

4

0

2

40

17949

14

0

2

18

13245

5

0

2

41

25685

15

1

3

19

13677

5

0

3

42

27837

16

1

2

20

15965

5

1

1

43

18838

16

0

2

21

12366

6

0

1

44

17483

16

0

1

22

21351

6

1

3

45

19207

17

0

2

23

13839

6

0

2

46

19346

20

0

1

 

二.模型假设

(1)薪金自然随着资历(年)的增长而增加;

(2)管理人员的薪金应高于非管理人员;

(3)教育程度越高薪金也越高;

(4)管理责任、教育程度、资历诸因素之间没有交互作用;

(5)资历(年)、管理水平、教育程度分别对薪金的影响是线性的;

(6)目前公司软件开发人员的薪金是合理的;

(7)在模型改进中我们假设资历(年)、管理水平、教育程度之间存在交互作

用。

三.问题的分析

对于问题,在符合题意并且与实际情况较吻合的情况下,薪金记作,资历(年)记作,为了表示是否非管理人员,定义

为了表示3种教育程度,定义,

这样,中学用=1,=0来表示,大学用=0,=1表示,研究生则用=0,=0表示。

对于影响变量的这些定性因素(管理,教育),在模型求解过程中我们采用“0-1”变量来处理,并运用数学软件matlab来求解,最后对所得的解进行讨论和分析。

四.模型的建立与求解

1.符号的说明:

软件开发人员的薪金

资历

管理责任

教育程度

带估计的回归系数(i=1,2,3,4,5,6)

随机误差

随机误差,回归系数的样本估计值

回归系数的估计值的置信区间

残差向量

R的置信区间

回归模型的检验统计量

回归方程的决定系数

统计量值

对应的概率值

剩余方差

置信水平0.05

 

2.模型的建立

薪金与资历,管理责任,教育程度,之间的多元线性回归方程为:

3.模型的求解

直接利用matlab统计工具箱中的命令regress求解,使用格式为:

[b,bint,r,rint,stats]=regress(y,x,slpha)

其中输入y为模型

(1)中的y的数据(n维向量,n=30),x为对应于回归系数的数据矩阵,alpha为置信区间;输出b为的估计值,bint为b的置信区间,r为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有四个值,第1个是回归方程的决定系数(是相关系数),第2个是统计量值,第3个是与统计量值对应的概率值,第4个是剩余方差。

根据上述方程式,我们用数学软件matlab对模型进行求解可以得到回归系数与其置信区间(置信水平=0.05),检验统计量,,,的结果,见表二。

表二模型

(1)的计算结果

参数

参数估计值

参数置信区间

11032

[10258,11807]

546

[484,608]

6883

[6248,7517]

-2994

[-3826,-2162]

148

[-636,931]

=0.579=226<0.0001=1.057x106

五.结果分析和检验

一.结果分析

从表二知=0.975,即因变量(薪金)的95.7%可由模型确定,值远远超过的检验的临界值,远小于,因而模型

(1)从整体来看是可用的。

比如,利用模型可以估计(或预测)一个大学毕业,有2年资历,费管理人员的薪金为:

=12272

模型中各个回归系数的含义可初步解释如下:

的系数为546,说明资历增加1年薪金增长546;的系数为6883,说明管理人员薪金多6883;的系数为-2994,说明中学程度薪金比更高的少2994;的系数为148,说明大学程度薪金比更高的多148,但是注意到置信区间包含零点,说明这个系数的解释不可靠。

需要指出,以上解释是就平均值来说,并且,一个因素改变引起的因变量的变化量,都是在其他因素不变的条件下成立的。

 

二.结果检验

的置信区间包含零点,说明基本模型

(1)存在缺点。

为了寻找改进的方向,常用残差分析方法(残差指薪金的实际值与用模型估计的薪金y1之差,是模型

(1)中随机误差的估计值,这里用了一个符号)。

我们将影响因素分成资历与管理-教育组合两类,管理-教育组合的定义如表三:

表三管理——教育

组合

1

2

3

4

5

6

管理

0

1

0

1

0

1

教育

1

1

2

2

3

3

为了对残差进行分析,图1给出了与资历的关系,图2给出与管理-教育,组合间的关系。

图1模型

(1)与的关系图2模型

(1)与—,组合

的关系

从图一看,残差大概分成3个水平,这是由于6种管理—教育组合混合在一起,在模型中未被正确反映的结果,、;从图2看,对于前4个管理—教育组合,残差或者全为正,或者全为负,也表明管理—教育组合在模型中处理不当。

在模型

(1)中国管理责任和教育程度是分别起作用的,事实上,二者可能起着交互作用,如大学程度的管理人员的薪金会比二者分别的薪金制和高一点。

以上分析提醒我们,应在基本模型

(1)中增加管理与教育,的交互项,建立新的回归模型。

六.优化方向

通过以上分析,我们在模型一中增加管理与教育,的交互项,建立新的回归模型。

模型记作:

利用matlab的统计工具得到的结果如表四:

表四模型

(2)的计算结果

参数

参数估计值

参数置信区间

11204

[11044,11363]

497

[486,508]

7048

[6841,7255]

-1727

[-1939,7255]

-348

[-545,-152]

-3071

[-3372,-2769]

1836

[1571,2101]

=0.9988=5545<0.0001=3.0047x104

由表四可知,模型

(2)的和值都比模型

(1)有所改进,并且所有回归系数的置信区间都不含零点,表明模型

(2)是完全可用的。

与模型

(1)类似,作模型

(2)的两个残差分析图(图3,图4),可以看出,已经消除了图1,图2中的不正常现象,这也说明了模型

(2)的适用性。

图3模型

(2)与的关系图4模型

(2)与—,

组合的关系

从图3,图4还可以发现一个异常点:

具有10年资历、大学程度的管理人员(从表1可以查出是33号),他的实际薪金明显地低与模型的估计值,也明显低于与他有类似经历的其他人的薪金。

这可能是由我们未知的原因造成的,为了使个别的数据不致影响整个模型,应该讲这个异常数据去掉,对模型

(2)重新估计回归系数,得到的结果如表五,残差分析图见图5,图6.可以看出,去掉异常数据后结果又有改善。

 

表五模型

(2)去掉异常数据后的计算结果

参数

参数估计值

参数置信区间

11200

[11139,11261]

498

[494,503]

7041

[6962,7120]

-1737

[-1818,,-1656]

-356

[-431,-281]

-3056

[-3171,-2942]

1997

[1894,2100]

=0.9998=36701<0.0001=4.347x103

图5模型

(2)去掉异常数据后图6模型

(2)去掉异常数据后与

与的关系与—,组合的关系

对于回归模型

(2),用去掉模型异常数据(33号)后估计出的系数,得到的结果是满意的。

作为这个模型的应用之一,不妨用它来"制订”6种管理—教育组合人员的“基础”薪金(即资历为零的薪金,当然,这也是平均意义上的)。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 工程科技 > 材料科学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1