优秀毕业生的评定模型.docx

资源描述

优秀毕业生的评定模型.docx

《优秀毕业生的评定模型.docx》由会员分享，可在线阅读，更多相关《优秀毕业生的评定模型.docx（27页珍藏版）》请在冰豆网上搜索。

优秀毕业生的评定模型.docx

优秀毕业生的评定模型

摘要

本文围绕着优秀毕业生的评选问题进行讨论，建立了基于层次分析和基于主成分分析的两种评定模型，利用聚类分析，层次分析，主成分分析，因子分析等方法建立了评定模型给出了合理的评定方案。

并对这两种评定模型进行比较，分析其优劣性。

首先

然后

最后

关键词层次分析主成分分析聚类分析因子分析

一、问题重述

几乎学校的每个院系每年在毕业季都会评定优秀毕业生。

评定优秀毕业生的目的奖励毕业生在大学学习阶段的成绩和鼓励在校学生学习积极性。

其中，学习成绩是优秀毕业生评定的主要依据之一，因此，如何根据学生的各门课成绩来合理衡量学生很有必要。

附件A是学院某专业2014年毕业的50名学生的学习情况。

请你们队根据附件信息，综合考虑各门课程，至少用2种方法将成绩最优秀的20%的同学评选出来，并进行排序，作为进一步优秀毕业生评定的候选人，并比较这些方法的优劣。

提交论文应明确说明你们队是如何考虑课程性质、学时、学分、成绩等因素的，以及你们队的主要结果及对该问题的建议。

二、问题分析

该问题要求用至少两种方法将成绩最优秀的20%的同学评选出来以此进行优秀毕业生的评定。

首先已知这50名学生在各个学期不同课程的课程学分，分数，绩点，课程类别，修读类别。

通过对学生成绩表的修读类别进行统计分析，发现存在一部分学生重修的情况，为了简化模型我们做出第一个假设，假设重修的学生都是不优秀学生。

这样我们可以对数据进行一次简化处理，删除所有重修记录的学生。

由于不同课程的重要性不同，为了判断在不同课程类别中各种课程对学生综合成绩的影响情况，我们将公共课，体育课等课程简化为六个基本课程类别分别为：

公共课，体育课，理工类，文管类，艺术类，专业课。

将提高学生专业水平，常识水平，体艺水平作为层次分析的准则层，通过定性指标模糊量化方法算出层次单排序（权数）和总排序。

考虑到变量之间是有一定的相关关系的，当两个变量之间有一定相关关系时，这两个变量反映此课题的信息有一定的重叠。

我们采用主成分分析设法将原来变量重新组合成一组新的互相无关的几个综合变量，同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息。

然后通过上述这两个算法建立两个模型将成绩最优秀的20%的同学评选出来，并进行排序，并比较这些方法的优劣。

最后对课程性质、学时、学分、成绩等因素进行统计分析。

三、模型的假设及符号说明

3.1模型的假设

●问题所给的数据真实可靠，学生无作弊现象，能够准确有效的反映学生成绩；

●所有重修的学生都是考试挂科的学生；

●所有课程性质和课程分类情况都是合理的；

●所有判断矩阵的设定也都是合理的

3.2符号说明

符号

符号说明

目标：

不同课程类别的重要性

准则：

提高学生专业水平

准则：

提高学生常识水平

准则：

提高学生体艺水平

判断矩阵的权重

判断矩阵的最大特征值

判断矩阵的一致性比率

四、模型建立

4.1模型的准备

在对学生成绩进行统计分析时，考虑到问题所给的数据有50名学生在各个学期，不同学科的的分数，绩点，课程类别等统计数据，其样本量较大，因此考虑采用Excel对数据进行初步处理。

其具体步骤如下：

我们使用Excel高级筛选功能将所有重修的学生排除在外，然后使用下面的方法

4.2主成分分析法

4.2.1算法介绍

主成分分析法principalcomponentanalysis（PCA）是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量，这些新的变量按照方差依次递减的顺序排列。

在数学变换中保持变量的总方差不变，使第一变量具有最大的方差，称为第一主成分，第二变量的方差次大，并且和第一变量不相关，称为第二主成分。

依次类推，I个变量就有I个主成分。

4.2.2指标体系的构建

1.对公共基础类、理工类、体育课、文管类、行业背景课、艺术类、专业平台、公共实践、专业实践、专业任选、专业限选所做的数据整理见附录

2.对原始数据进行整理

用MATLAB对原始数据处理，得到特征值、差值、贡献率、累计贡献率

容易看出，前一个成分就已经达到85%，再加上第二个主成分达到了99.56%，所以只用前两个主成分就可以了。

3.由上面结果可以得到前两个主成分的得分数据

得到前两个主成分的表达式

4.对最后阶段分析

第一主成分对于每一个学生的相关系数都近似，我们使用前两个主成分来分析学生的综合成绩是合理的，接下来引入了一个新的指标—评价

通过评价，可以清楚看到专业平台和公共基础课的评价为较大正值，我们主观地认为学生的评定仅受专业平台和公共基础课的影响。

5.引入一个新的公式来计算

其中E—评定，T—评价，L—课程类别分数.

根据公式，计算得到如下前10（20%）表格如下

学生

公共基础类

专业平台

评定

排名

林林

4010.2

5767

332468.7

王栋

3769

5613

319985.6

大张

4060.8

5259.5

314057.7

天金

3708.3

5317

306822.3

小坤

3136.5

5247

288724.8

小林

3906.6

4528.5

281434.3

伟伟

3563.3

4750

280835.3

大方

3572.3

4686.5

278603.4

晓东

3371.2

4797

277502.6

鑫鑫

3704.6

4398

270920.3

4.3层次分析法

4.3.1算法介绍：

在日常工作、生活中的决策问题，涉及到经济，社会等发面的因素，作比较判断时人的主观选择起相当大的作用，各因素的重要性难以量化。

我们采用的层次分析法，是匹茨堡大学教授ThomasL.Satty于1960年代发明的一种多因素决策方法。

通过把复杂的多因素决策问题分解为多个层次上的子因素的相互比较和权重计算问题，能够以较为直观的方式实现对多个可能采取的选择排序并择优。

4.3.2原则和设计

为了达到选出优秀毕业生的目的，我们对层次分析法的三个特点进行分析：

以层级模型表示决策问题：

以需要解决的决策作为最高的层级和模型的出发点，我们将决策问题分解为几个影响最终决策效果的因素。

在原则之下，是决策者可采取的各种选择。

这样，决策者可以清晰地表示对决策问题的认识，以及各种影响因素的分类关系。

分层级的两两比较：

在决策过程的任一时刻，决策者只对某一评价原则下的两个选择。

每次只比较两个不同的事物尽可能排除其他选择和评价原则造成的干扰。

内建的一致性评价：

层次分析法不要求在两两比较过程中的一致性，但对各个评价原则合并后的结果，应具有一致性，这样才能确保获得决策者需要的最优结果。

层次分析法采用被称为一致性比率的工具来表示两两比较结果的一致性水平。

4.3.3步骤

1.识别决策目标：

我们的目标是判断不同的课程类别的重要性（记为A）；

2.对评价原则分层，得到问题的层次结构：

以目标为最高层次，找到提高水平的种类为中间的层级（B1：

可提高专业水平的课程；B2：

可提高常识的课程；B3：

可提高体艺水平），可选项（P1：

公共课、P2：

体育课、P3：

理工类、P4：

文管类、P5：

艺术类、P6：

专业课）放在最底层。

如图1.3.1

图1.3.1

3.对每个层次内的各元素进行两两比较，从最低的评价原则层级开始。

对此我们采用1-9标度法判断矩阵进行两两比较。

1-9标度法如下：

1表示两个元素相比，具有同样的重要性

3表示两个元素相比，前者比后者稍重要

5表示两个元素相比，前者比后者明显重要

7表示两个元素相比，前者比后者极其重要

9表示两个元素相比，前者比后者强烈重要

2，4，6，8表示上述相邻判断的中间值

若元素i和元素j的重要性之比为aij,那么元素j与元素i的重要

性之比为aji=1/aij

例如，公共课P1、体育课P2在提高体艺水平B3的条件下P2对P1极其重要，所以标度记为7.

对每个层级之间和层级之内的各个评价原则也要两两比较重要程度，并记录相关的矩阵。

4.处理比较结果：

用MATLAB编程，实现层次分析法的计算（见附录1）。

5.得到比较结果：

得到中间层次的权重。

4.3.4模型求解

1.计算各准则在目标下的权重

设定的A对B1、B2、B3的判断矩阵为

得到的第二层对第一层的权重、最大特征值、一致性比率，如下表

第二层

权重

0.7306

0.1884

0.0810

最大特征值

3.0649

一致性比率

0.0559

2.计算得到可选项在第二层下的权重

在B1下设定对P3、P4、P6的判断矩阵为

计算得到B1对第三层的数据，如下表

第三层在B1下

权重

0.1429

0.7143

最大特征值

一致性比率

在B2下设定对P1、P2、P5的判断矩阵为

计算得到B2对第三层的数据，如下表

第三层在B2下

权重

0.6000

0.2000

最大特征值

一致性比率

在B3下设定对P1、P2、P5的判断矩阵为

计算得到B2对第三层的数据，如下表

第三层在B3下

权重

0.0667

0.4667

最大特征值

一致性比率

3.根据第2步计算第三层在目标下的权重

得到数据表格

第三层在A下

权重W

0.1184

0.0755

0.1044

0.0755

0.5219

4.我们把得到的权重与每个人的Pi（i=1，2，3，4，5，6）成绩进行线性乘加，于是得到如下表格，表格为层次分析法得到的优秀毕业生评定前10（20%）

具体公式如下

公选课

体育课

理工类

文管类

艺术

专业课

综合得分

排名

林林

83.58115

89.47475

85.80568

王栋

79.90265

84.25

86.5

85.32579

85.27248

小坤

75.81553

85.07692

82.70661

天金

80.77117

80.66667

80.5

84.54023

81.37639

伟伟

77.49643

91.25

82.5

78.59574

80.61107

晓东

74.43214

99.5

80.89947

78.92285

大方

78.08571

76.5

77.38806

78.18283

大川

75.72542

80.25

75.46703

78.00791

杨怡

76.28214

83.5

78.33333

73.6

76.4689

伟平

73.84464

91.25

76.5

73.67742

75.72938

五、模型的优缺点

优点

1.模型按照归类的方法将课程根据课程性质分类，层次清晰；

2.模型运用Excel表格，在进行处理时，极大提高了数据的准确性。

模型大部分过程都能够使用Excel完成；

3.模型在选择优秀毕业生的排名时，采用两种方案进行，最后得出最优方案；

4.模型将对象作为一个系统，按照分解、比较判断、综合的思维方式进行决策；

5.模型确定的层次分析法每一层的权重设置最后都直接或间接影响到结果，而且在每个层次中的每个因素对结果的影响程度都是量化的，非常清晰、明确；

6.模型把判断各要素的相对重要性的步骤留给了大脑，只保留人脑对要素的印象，化复杂的算法为简单的权重进行计算，大大简化步骤。

缺点

1.模型去除了重修的学生，忽略了有些不确定因素，必然对模型的结果带来误差；

2.模型对课程的分类比较主观，也会对结果带来影响；

3.由于数据比较多，在使用Excel时也可能因为人为因素带来偏差

六、参考文献

[1]

附录1

AHPSolver

HierarchyNumofAhp

NumberofelementineveryHierarchy

[136]

ans=

pleseinputtheDecMatrixof1thHierarchy

DoyouwantinputDecMatrixinthisHierarchy?

1or0

ans=

pleseinputthe1row1th:

DecMatrix

ans=

thepositionof支配元素in1th层

ans=

thepositionof被支配元素in2层

[123]

DecMatirx

[157;1/513;1/71/31]

theweightofthisDecMatrix:

ans=

0.7306

0.1884

0.0810

theDecMatrix.LamdaMax:

ans=

3.0649

DecMatrix.CR:

ans=

0.0559

DoyouwantinputDecMatrixinthisHierarchy?

1or0

thisDecMatrixinthisHierarchyInputover

weightKtoTop=

0.7306

0.1884

0.0810

ans=

pleseinputtheDecMatrixof2thHierarchy

DoyouwantinputDecMatrixinthisHierarchy?

1or0

ans=

pleseinputthe2row1th:

DecMatrix

ans=

thepositionof支配元素in2th层

ans=

thepositionof被支配元素in3层

[346]

DecMatirx

[111/5;111/5;551]

theweightofthisDecMatrix:

ans=

0.1429

0.7143

theDecMatrix.LamdaMax:

ans=

DecMatrix.CR:

ans=

DoyouwantinputDecMatrixinthisHierarchy?

1or0

ans=

pleseinputthe2row2th:

DecMatrix

ans=

thepositionof支配元素in2th层

ans=

thepositionof被支配元素in3层

[125]

DecMatirx

[133;1/311;1/311]

theweightofthisDecMatrix:

ans=

0.6000

0.2000

theDecMatrix.LamdaMax:

ans=

DecMatrix.CR:

ans=

DoyouwantinputDecMatrixinthisHierarchy?

1or0

ans=

pleseinputthe2row3th:

DecMatrix

ans=

thepositionof支配元素in2th层

ans=

thepositionof被支配元素in3层

[125]

DecMatirx

[11/71/7;711;711]

theweightofthisDecMatrix:

ans=

0.0667

0.4667

theDecMatrix.LamdaMax:

ans=

DecMatrix.CR:

ans=

DoyouwantinputDecMatrixinthisHierarchy?

1or0

thisDecMatrixinthisHierarchyInputover

weightKtoTop=

0.1184

0.0755

0.1044

0.0755

0.5219

附录2

>>uiopen（'D:

\ProgramFiles\matlab7.0\work\主成分数据表1.xls',1）

>>[X1,textdata]=xlsread（'D:

\ProgramFiles\matlab7.0\work\主成分数据表1.xls'）;

>>X=zscore（X1）

Columns1through8

1.73041.54641.59732.05091.44661.48091.35871.7072

-0.5506-0.5565-0.4643-0.5760-0.5155-0.5838-0.5837-0.4846

-0.5622-0.6270-0.5498-0.4361-0.5762-0.5277-0.6008-0.5605

-0.5479-0.5631-0.5887-0.2875-0.5767-0.5850-0.5980-0.5612

-0.7006-0.7185-0.7031-0.5847-0.6576-0.5850-0.7157-0.7058

-0.6692-0.7014-0.7126-0.5777-0.6620-0.5757-0.6974-0.6820

2.20082.27992.30411.93752.40682.41222.41282.2224

-0.2505-0.2784-0.1718-0.0176-0.3193-0.2176-0.3696-0.2648

-0.4484-0.4334-0.4059-0.5125-0.4215-0.4843-0.3550-0.4558

-0.00070.2670-0.0255-0.51430.0523-0.07900.0966-0.0113

-0.2010-0.2149-0.2797-0.4821-0.1767-0.25500.0523-0.2037

Columns9through16

1.59971.55171.20211.75381.51241.44351.69341.6539

-0.5484-0.5666-0.6502-0.6968-0.6610-0.6656-0.6340-0.5562

-0.5240-0.5372-0.5061-0.5626-0.5317-0.5093-0.5884-0.5603

-0.5498-0.5601-0.5600-0.4505-0.4909-0.5868-0.5082-0.4659

-0.6948-0.6711-0.6740-0.7007-0.6485-0.6919-0.7862-0.6812

-0.6739-0.6711-0.6752-0.6813-0.6582-0.6814-0.7516-0.6784

2.30732.32682.52432.15702.35072.38002.17302.2736

-0.2729-0.2685-0.2818-0.3030-0.2278-0.2472-0.3217-0.2714

-0.4466-0.4556-0.4453-0.4635-0.4964-0.4429-0.3394-0.4603

-0.02890.10350.0427-0.06800.1030-0.04820.0411-0.0456

-0.1676-0.25180.02330.0156-0.25170.04970.0221-0.2082

Column17

1.5520

-0.5679

-0.5618

-0.7034

-0.6925

2.2889

-0.2726

-0.4180

-0.0311

0.0990

>>[COEFF,SCORE,latent,tsquare]=princomp（X）

COEFF=

Columns1through8

-0.2435-0.13000.06480.2109-0.0855-0.1789-0.0648-0.0262

-0.24290.1111-0.10260.53480.1870-0.18640.16890.1570

-0.2434-0.0619-0.21700.1286-0.41680.23090.51030.0689

-0.2332-0.7969-0.0767-0.30760.05530.12020.10990.1458

-0.24340.1404-0.21010.0322-0.13410.2448-0.39490.0678

-0.24320.0162-0.3754-0.2574-0.0712-0.2930-0.32120.4655

-0.24230.31130.1290-0.0614-0.06510.3591-0.21600.3553

-0.2436-0.11120.02190.2142-0.2680-0.0199-0.1631-0.4523

-0.2439-0.0203-0.0348-0.0006-0.10250.0866-0.0864-0.3263

-0.24370.0353-0.20950.20230.0894-0.13170.0062-0.0967

-0.24110.3669-0.1422-0.43270.20980.20770.2259-0.2914

-0.2427-0.11650.4688-0.06180.3644-0.1550-0.2716-0.0975

-0.24340.0409-0.25730.07210.4887-0.

展开阅读全文