广西区首届研究生数学建模竞赛一等奖论文基于模糊数学理论的高等学校助学金等级评定设计模型汇编.docx
《广西区首届研究生数学建模竞赛一等奖论文基于模糊数学理论的高等学校助学金等级评定设计模型汇编.docx》由会员分享,可在线阅读,更多相关《广西区首届研究生数学建模竞赛一等奖论文基于模糊数学理论的高等学校助学金等级评定设计模型汇编.docx(26页珍藏版)》请在冰豆网上搜索。
广西区首届研究生数学建模竞赛一等奖论文基于模糊数学理论的高等学校助学金等级评定设计模型汇编
广西区首届研究生数学建模竞赛
题目
摘要:
竞赛题目:
针对高校助学金等级评定这一热点问题,我们将众多因素分类,归为班级评定、家庭年收入、月消费金额、国家助学贷款因素、单亲因素、医疗支出因素、教育支出因素、债务因素、突发性因素。
将这些影响评定结果的因素作为变量,利用模糊数学的方法来建立模型,通过求解来计算他们各自对最后结果的影响程度。
第一步是分析众多影响因素,同时忽略一些属于偶发的特例。
将所有数据以人为一组,根据统计,利用模糊统计方法来计算其隶属值,设定隶属值一等为,二等为,三等为。
设N为单个学生的单个因素的模糊关系矩阵,M为银子权重矩阵,S为总体评定结果。
N、S的结果通过对全部数据进行模糊统计求得,M通过方程求得。
M反映的是单个因素对评价整体的影响程度
最后,根据N,带入M值,可得出最终结果,据此判定助学金等级。
论文正文
基于模糊数学理论的高等学校助学金等级评定设计模型
一、问题的重述
随着2007年国家资助高校贫困生新政策的出台,国家对贫困生的资助力度和资助面都在加大。
根据新的资助政策的要求,各地各高校根据本地实际情况制定本校的家庭经济困难认定办法。
但在评审的过程中,因为资助力度的加大,覆盖面的加大,又出现了一些新问题。
此外,家庭经济困难学生认定工作包含了太多的因素,而当前我国高校已经有的助学金等级评定方法大多采用定性或半定量的方法,而不是完全定量的方法。
这种评定方法存在一定程度的主观因素过强、信息不对等和不容易操作等问题。
统计学上的定性数据包括分类数据和顺序数据,是一组表示事物性质、规定事物类别的文字表述型数据,不能将其量化,只能将其定性。
定量数据就是可以被量化的、用数值表示大小的数据。
通常各地各高校将家庭经济困难学生大体分为2—3档,分为2档的等级为:
一般困难和特别困难;分为3档的等级为:
一般困难、比较困难和特别困难。
困难学生的比例一般在20%左右。
西部高校、农林地矿油核高校、理工科类高校困难学生比例稍高约在25—30%。
本文要解决的问题是:
1、在参考附录文件的基础上,用数学建模的方法给出一种更公平、易操作的全定量助学金等级评定方法,并用附录的数据说明给出方法的合理性;
2、缩小给与不给的差距;
3、明确界定一般困难和不困难。
二、问题的分析
要评定高等学校助学金等级,首先要对学生的贫困程度作一个划分。
而对于鉴定一个学生是否为贫困生,其影响因素有很多,本题所列举的因素有6个,例如班级评定的困难等级、家庭年收入、月消费金额、是否国家贷款、是否生源地贷款和贫困原因。
而对于影响贫困程度的诸多因素中,其界定标准是不太明确的,而且定性描述很多,因此需要利用一种统一的标准,使这些不同的因素定量化,方可以进行计算。
本文引进模糊综合评价方法,运用模糊数学的基础理论将其定性的描述(如困难等级、贫困原因等)进行定量化,并根据各因素的隶属特征用模糊统计方法得出评价指标的权重分配,建立起模糊数学模型,最后汇总计算出助学金等级评价指数,以此来判断出该给与何等奖学金。
三、问题假设与约定
1.等级认定中忽略除了提及因素之外的其他不可预测的因素;
2.因素六“贫困原因”分离成四个一级指标后,每个指标均可单独成为一个因素来进行评价而对结果不造成影响;
3.在综合评价模型中,为考查一学生的贫困程度,家庭年收入情况与月消费情况等其他因素而选取的考查时段是具有代表性的
4.题中给出的数据真实可靠。
5.国家在短时间内不会改变发放助学金政策。
四、符号说明及其名词定义
A——班级评定贫困等级
B——家庭年收入因素
C——家庭月消费因素
D——是否已办过国家或者生源地贷款因素
E——单亲因素
F——家中是否有其他兄弟姐妹读书因素
G——家庭是否有固定收入因素
H——家庭成员医疗费用的因素
M——权重因子矩阵
P——加权因子
R——模糊关系矩阵
S——总体评定结果向量
V——评语等级论域
U——评价因素论域
隶属度——若对论域(研究的范围)U中的任一元素x,都有一个数A(x)∈0,1与之对应,则称A为U上的模糊集,A(x)称为x对A的隶属度
论域——任何科学理论中的研究对象构成的一个不空的集合。
频数——一组数据在某个确定的范围内出现的数据的个数
五、模型建立与求解
5.1.数据的分析与处理
5.1.1.剔除定量数据中的异常值
众所周知,对于所获得的一批定量化数据,由于受各种各样的因素影响,总会存在异常值。
这些异常值值得关注,忽视异常值的存在有时是十分危险的,不加剔除地把异常值包括进模型数据的计算分析过程中,对模型的结果会带来不良影响。
那么,如何对数据中的异常值进行判别?
箱线图为我们提供了识别异常值的标准,使用箱线图可以直观的识别数据中的异常值,而且结果比较客观。
本题附录数据中所给出的定量化数据有两组,一组是家庭年收入,另外一组是月消费金额。
要想利用数据进行分析,首先得把异常值排除。
对此我们通过matlab软件编程对这两组数据进行箱线图描绘,经分析图形得出,家庭年收入因素中存在异常值,大于15000的为异常值;月消费金额中存在异常值,大于500的为异常值,如下图1、图2所示。
图1
图2
我们将存在异常值的各行数据在EXCEL里用筛选法把其筛选出来,并把它另存一个EXCEL数据表,从而将其剔除掉。
5.1.2.确定研究样本数据
剔除异常值后的数据既可作为建模的研究依据,即通过研究该数据的规律反过来建立模型;又可以用来对所建数学模型的合理性检验。
但这样会出现一个问题:
用原数据(即剔除异常值后的数据,以下相同)建立模型后,再用它反过来检验模型,模型的准确性肯定体现不出来。
因此本文将一部分数据从原数据中抽样分离出来,从而将原数据分为两个部分,一部分数据用作研究建立模型用,称为样本数据;另外一部分用于模型的合理性检验,称为检验数据,这样既减少了要处理的数据量,又可对模型实行其准确性的检验。
样本数据的抽样方法:
以定量化数据为抽样基准。
考虑到家庭年收入因素变化较月消费金额大,且异常值较多,故以其作为抽样研究对象,并确定采用分层抽样方法。
将家庭年收入按国家助学金的一、二、三等级分成互不交叉的三层,然后再按照一定的比例,从各层独立地抽取一定数量的个体,并保证该个体具有典型代表性,最后将各层取出的个体合在一起作为样本。
为方便计算,抽取100个数据作为样本数据,剩下129个数据作为模型检验数据。
5.1.3.定性数据定量化
如何将定性数据全部定量化是本文需要解决的重要问题,为避免重复阐述,这里将该方法的具体步骤放到“5.2.模型的建立”这一小节来讨论。
5.2.模型的建立
5.2.1.建模的思想
模糊综合评价方法,是一种利用模糊集理论对某一考核系统进行综合评价十分有效的多因素决策方法。
在贫困生贫困程度认定中涉及大量定性指标及多种影响因素相互作用,运用模糊综合评价法建立的数学模型有利于量化定性指标,并综合定量指标,做出较为科学的综合评价[1]。
模糊综合评价方法应用模糊关系合成的原理,从多个因素对被评判事物隶属等级状况进行综合性评价[2]。
它包含五个基本要素:
(l)评价因素论域U;
(2)评语等级论域V;(3)模糊关系矩阵R;(4)评价因素权重向量M;(5)总体评定结果向量S。
针对本题的具体情况,该方法的思想,首先是确定影响因素并构成因素集,然后根据样本数据100人的统计结果,利用模糊统计方法来计算出隶属度。
由于对一个贫困生的总体评定是对单个影响因子进行综合的结果,并且每个因子对于总体评定结果的影响是不同的,令M为因子权重矩阵,R为不同学生个体的单个因素模糊关系矩阵,S为总体评定的结果,则有下面的模糊关系方程:
S=R*M。
S、R的结果已经通过模糊统计的方法获得,M则可以通过S=R*M方程来求解。
M值在实际运用当中有着重要意义,它反映了各因素对评定结果的影响程度,任意一个学生可根据具体情况写出其单个因素模糊关系矩阵,再把M值代入,便可算出其最终结果,根据它便可判断所属等级[3]。
5.2.2.建模具体步骤
a).建立评价因素论域U。
将各影响因素按顺序组合成一个因素集,这些因素的集合便为评价因素论域,记为U=(A,B,C,D,E,F,G,H),论域中的各个元素(如A)表示各个影响因素。
b).确定评价的指标体系。
根据因素集U建立起一个二级指标评价体系表,如下表所示。
需要说明的是,由于因素六“贫困原因”比较复杂,为了使其便于分析,这里将它归纳分离为父母情况(E)、有无其他人读书(F)、家庭有无固定收入(G)和健康情况(H)等四个一级指标。
表1
因素集构成的二级评价指标系统
一级指标
二级指标
A:
班级评定的困难等级
A1特困生
A2一般困难学生
B:
家庭年收入情况(由箱线图统计得出)
B1X<=2000
B22000B35000B4X>8000
C:
家庭月消费情况(由箱线图统计得出)
C1X<=200
C2200C3300C4X>350
D:
贷款情况
D1无贷款
D2有贷款
D3生源地贷款
E:
父母情况
E1孤儿
E2单亲
E3双亲
F:
有无其他人读书
F1有1人以上
F2没有
G:
家庭有无固定收入
G1没有固定收入
G2有固定收入
H:
健康情况
H1有成员不健康
H2所有成员都健康
c).确定评语等级论域V。
对每个因素的评价可以有几个评语,根据题目所给的附录数据可知,助学金等级的评语有三级:
一等(v1)、二等(v2)、三等(v3)。
因此评语等级论域为V=(vl,v2,v3)。
d).统计得出模糊矩阵R。
给定评语等级论域V=(vl,v2,v3)的一个加权因子P=[0.8,0.5,0.2],运用模糊统计知识计算得出上表各个二级指标因素(如A1、A2,B1、B2等)的隶属度,然后以样本数据为基础,统计出100个学生关于各因素的模糊关系矩阵R(计算过程见“5.3.模型的求解”)。
到此步,所有的定性数据已经全部量化成一个模糊关系矩阵R,这个矩阵是用来求出权重因子M值的,它对于评定等级结果有很大影响,故也常被称之为评价矩阵。
由此可见,求出评价矩阵R的过程,实质也是量化定性指标的过程,这就很好地解决了题目中如何将定性数据定量化的问题。
e).计算出评价因素权重向量M值。
根据公式S=R*M,结合统计结果得出的S、R值,最终可算出M值来。
我们所建立的模型就是把每个可能影响最后评定等级的因素设为变量,通过求模糊数学来求解它对最终结果的影响程度,构造一个F公式求解X,X即判定值:
X=Ai*x1+Bi*x2+Ci*x3+Di*x4+Ei*x5+Fi*6x+Gi*x7+Hi*x8。
这里M=[x1x1x1x1x1x1x1x1]T,给定评语等级论域V=(vl,v2,v3)的一个加权因子P=[0.8,0.5,0.2],赋一个学生的具体因素情况进去之后与权重因子相乘得出X值来,根据X的值落在哪个加权因子的小邻域内,便可认定该学生的贫困等级。
5.3.模型的求解
以样本数据为基础,根据建模的具体步骤,给出模型求解的详细过程。
5.3.1.求解隶属度问题
求解隶属度,须构造隶属函数,而隶属函数是模糊数学中最重要、最基本的量。
确定隶属函数有多种方法,在本文中采用模糊统计方法来确定。
现在以班级评定的困难等级因素A为例,将其具体的操作过程描述如下:
对于A的两种情况“特困生A1”、“一般困难A2”,给定三个评语等级(一等、二等、三等)。
根据样本数据进行统计得出各困难等级获助学金等级的人数,如:
是特困生且获得一等助学金的人数为41个,是特困生且获得二等助学金的人数为12个,是特困生且获得三等助学金的人数为0个,依次填入A1所在的列上,如表2所示。
然后给定评语等级论域V=(vl,v2,v3)的一个加权因子P=[0.8,0.5,0.2],并定义频数为A1分别获一二三等助学金的人数总和,即为41+12=53。
若Ai的评语频数为A=[a1,a2,a3]T,则隶属度为:
U(i)=(0.8*a1+0.5*a2+0.2*a3)/(a1+a2+a3),即:
U(A1)=0.8*(41/53)+0.5*(12/53)=0.73。
根据以上公式,由样本数据所给出的100组统计数据可得以下8个因素的隶属度的总结,分列于如下8个表格。
(1).关于班级评定的困难等级因素
表2
困难等级
等级
A1
A2
一等
41
0
二等
12
20
三等
0
27
由表可知:
U(A1)=0.8*(41/53)+0.5*(12/53)=0.73
U(A2)=0.5*(20/47)+0.2*(27/47)=0.33
(2).关于家庭年收入因素
先作如下规定:
年收入在2000及2000以下的记为B1,2000-5000的记为B2,5500-8000的记为B3,大于8000的记为B4。
表3
家庭年收入
等级
B1
B2
B3
B4
一等
17
10
9
5
二等
2
9
9
12
三等
4
7
12
4
由表可知:
U(B1)=0.8*(17/23)+0.5*(2/23)+0.2*(4/23)=0.67
U(B2)=0.8*(10/26)+0.5*(9/26)+0.2*(7/26)=0.53
U(B3)=0.8*(9/30)+0.5*(9/30)+0.2*(12/30)=0.47
U(B4)=0.8*(5/21)+0.5*(12/21)+0.2*(4/21)=0.51
(3).关于月消费金额因素
规定:
月消费金额在200或200以下的为C1,230-300的为C2,320-350的为C3,大于350的为C4。
统计结果如下:
表4
月消费金额
等级
C1
C2
C3
C4
一等
21
12
2
7
二等
6
11
6
9
三等
5
11
2
9
由表可知:
U(C1)=0.8*(21/33)+0.5*(6/33)+0.2*(5/33)=0.63
U(C2)=0.8*(12/34)+0.5*(11/34)+0.2*(11/34)=0.51
U(C3)=0.8*(2/10)+0.5*(6/10)+0.2*(2/10)=0.5
U(C4)=0.8*(7/35)+0.5*(9/35)+0.2*(9/35)=0.34
(4).关于贷款情况因素
规定:
没有贷款为D1,有贷款D2,生源地贷款D3
统计结果如下:
表5
贷款情况
等级
D1
D2
D3
一等
12
27
2
二等
13
19
0
三等
8
19
0
由表可知:
U(D1)=0.8*(12/33)+0.5*(13/33)+0.2*(8/33)=0.53
U(D2)=0.8*(27/66)+0.5*(19/66)+0.2*(19/66)=0.53
U(D3)=0.8*(2/2)=0.8
(5).关于父母情况因素
规定:
孤儿为E1,单亲为E2,双亲为E3
统计结果如下:
父母情况
等级
E1
E2
E3
一等
0
5
36
二等
0
1
31
三等
0
1
26
表6
由表可知:
U(E1)=0.0
U(E2)=0.8*(5/7)+0.5*(1/7)+0.2*(1/7)=0.67
U(E3)=0.8*(36/93)+0.5*(31/93)+0.2*(26/93)=0.53
(6).关于有无其他人读书情况因素
规定:
有其他人读书为F1,没有其他人读书为F2
统计结果如下:
表7
有无其他人读书
等级
F1
F2
一等
17
24
二等
16
16
三等
9
18
由表可知:
U(F1)=0.8*(17/42)+0.5*(16/42)+0.2*(9/42)=0.56
U(F2)=0.8*(24/58)+0.5*(16/58)+0.2*(18/58)=0.53
(7).关于家庭有无固定收入因素
规定:
没有固定收入为G1,有固定收入为G2
统计结果如下:
表8
收入
等级
G1
G2
一等
12
29
二等
4
28
三等
11
16
由表可知:
U(G1)=0.8*(12/27)+0.5*(4/27)+0.2*(11/27)=0.51
U(G2)=0.8*(29/73)+0.5*(28/73)+0.2*(16/73)=0.55
(7).关于家庭有无固定收入因素
规定:
家庭有人不健康为H1,家庭成员都健康H2
健康情况
等级
H1
H2
一等
19
23
二等
16
16
三等
5
22
统计结果如下:
表9
由表可知:
U(H1)=0.8*(19/40)+0.5*(16/40)+0.2*(5/40)=0.6
U(H2)=0.8*(23/61)+0.5*(16/61)+0.2*(22/61)=0.5
5.3.2.求解M值及评定给予何种等级国家助学金问题
M值的求解公式是S=R*M,S、R值可根据样本数据中100个学生的统计结果表10得出。
表10为样本数据中100个学生关于各个因素的隶属值,学生编号是从1到100,ABCDEFGH这8个因素所有的值构成模糊关系矩阵R,右边最后一列所有的值构成的向量为总体评定结果向量S,这样就可以根据S=R*M公式用matlab编程来求出M值来了(具体执行程序见附件),这里算得M=[0.9559,0.1239,0.0583,0.1222,0.1738,-0.0118,-0.6837,0.2628]。
从M值可以看出各个因素对评定结果的影响程度,A(班级评定困难等级因素)对评定结果影响最大,其次是G(家庭有无固定收入因素)和H(健康情况因素),其他的因素对评定结果影响不大。
对于如何评定助学金等级问题,则是根据X值来判定,原则是根据X的值落在哪个加权因子的小邻域内,便可认定该学生的贫困等级,这里取的加权因子是P=[0.8,0.5,0.2]。
例如:
某学生的因素为[A1B1C1D1E3F2G1H1],则该学生的判定值为
X=A1*x1+B1*x2+C1*x3+D1*x4+E3*x5+F2*6x+G1*x7+H1*x8,X=0.73,落在0.8的小邻域范围内,故该生为特别贫困,可获得一等助学金。
表10
编号
A
B
C
D
E
F
G
H
S值
1
A10.73
B10.67
C10.63
D10.53
E30.53
F20.53
G10.51
F10.6
0.8
2
A10.73
B10.67
C20.51
D10.53
E30.53
F20.53
G20.55
F10.6
0.8
3
A10.73
B10.67
C10.63
D10.53
E30.53
F20.53
G20.55
F10.6
0.8
4
A10.73
B10.67
C20.51
D10.53
E30.53
F10.56
G20.55
F10.6
0.8
5
A10.73
B10.67
C10.63
D10.53
E30.53
F10.56
G20.55
F10.6
0.8
6
A10.73
B10.67
C10.63
D10.53
E30.53
F10.56
G10.51
F20.5
0.8
7
A10.73
B10.67
C10.63
D10.53
E30.53
F10.56
G20.55
F20.5
0.8
8
A10.73
B10.67
C10.63
D20.53
E30.53
F20.53
G20.55
F10.6
0.8
9
A10.73
B10.67
C10.63
D10.53
E30.53
F20.53
G10.51
F20.5
0.8
10
A10.73
B10.67
C10.63
D10.53
E30.53
F10.56
G20.55
F10.6
0.8
11
A10.73
B10.67
C20.51
D10.53
E20.67
F20.53
G10.51
F20.5
0.8
12
A10.73
B10.67
C10.63
D10.53
E30.53
F20.53
G10.51
F10.6
0.8
13
A10.73
B10.67
C20.51
D10.53
E30.53
F20.53
G10.51
F20.5
0.8
14
A10.73
B10.67
C10.63
D10.53
E30.53
F10.56
G20.55
F10.6
0.8
15
A10.73
B10.67
C10.63
D10.53
E20.67
F20.53
G10.51
F10.6
0.8
16
A10.73
B10.67
C10.63
D10.53
E30.53
F10.56
G20.55
F20.5
0.8
17
A10.73
B10.67
C20.51
D10.53
E30.53
F20.53
G10.51
F20.5
0.8
18
A10.73
B20.53
C10.63
D20.53
E30.53
F10.56
G10.51
F10.6
0.8
19
A10.73
B20.53
C10.63
D20.53
E20.67
F20.53
G20.55
F20.5
0.8
20
A10.73
B20.53
C10.63
D10.53
E30.53
F20.53
G10.51
F20.5
0.8
21
A10.73
B20.53
C10.63
D10.53
E30.53
F20.53
G10.51
F20.5
0.8
22
A10.73
B20.53
C20.51
D10.53
E30.53
F10.56
G20.55
F10.6
0.8
23
A10.73
B20.53
C10.63
D10.53
E20.67
F20.53
G10.51
F20.5
0.8
24
A10.73
B20.53
C30.5
D10.53
E30.53
F20.53
G10.51