1、吉林财经大学2011-2012学年第一学期多元统计分析期末论文一二三四五总分学院:工商管理学院专业:人力资源管理年级:2009级学号:姓名: 西甲球员的综合能力统计分析摘要:足球运动是一项古老的体育活动,是目前全球体育界最具影响力的单项体育运动。球员是足球运动中不可缺少的部分,球技是影响球员乃至球队发展的重要因素。本文通过网上搜集西甲联赛部分球员的技术数据统计为依据,运用spss软件对不同球员的球技进行因子分析和聚类分析。关键词:足球、球员、球技、因子分析、聚类分析引言:足球是世界最受欢迎的一项运动,故有世界第一大运动的美称!当今足球运动已成为人们生活中不可缺少的组成部分,不论在任何地区,足球
2、都成为了一项不可或缺的运动。当今世界各地都有足球联赛,各地也都有不同形式的球队及比赛,据不完全统计,现在世界上经常参加比赛的球队约80万支,登记注册的运动员约4000万人,其中职业运动员约10万人。当然,球员的水平也不尽相同,每个人心中都有各自所喜爱的球队及球员。当今世界两大豪门为巴塞罗那和皇家马德里,他们深受世界大多数人们的喜爱,所以本文选择了最受人们欢迎的西甲球员进行数据统计分析。一、 指标选取进行球员技术的数据统计分析,必须选取合适的指标,做到全面准确地反映每一个球员的技术,对不同的球员加以区分,综合的反映一个球员的技术水平,因此从出场、出场时间、进球、助攻、射门等方面选取了能够反映个人
3、球技水平的10项指标,分别为:X1出场(次)X2出场时间(分)X3进球(个)X4助攻(个)X5射门(次)X6射正(次)X7犯规(次)X8越位(次)X9黄牌(张)X10角球(个)原始数据的收集与整理:球员出场出场时间进球助攻射门射正犯规越位黄牌角球梅西2118282311123592217344c罗201743238132521718324阿德里亚诺1274413846108比利亚1912198254251222219伊瓜因219531413723132415罗西121019305923918518卡卡1571544191281111洛伦特1815028151203717012哈维1914876
4、52493108厄齐尔201314161910169212莱昂4253101133121尼尔马10590201066103赫迪拉15919101147113蒂亚戈126210013318131皮克1065411229161马塞洛1614032213313016索尔达多22169816161272718521本泽马2012571285828161908佩德罗169055232151411115苏亚雷斯161250008125070内格雷多1284251311514236卡纳莱斯1158310936316法尔考19159812163343418012法布雷加斯1610949522159538伊涅斯
5、塔1272914238102111阿尔维斯119901440000020佩佩161394106317440普约尔1174810539020拉莫斯2017552312538240阿隆索2117761415426071卡列洪10361601594306华金1310632016786313迪亚拉13946017133052凯塔19979006125112二、因子分析因子分析是一种数据简化的技术,它是将具有相关性的多个 原始变量通过空间线性变换为较少的几个抽象的综合指标的一种方法。得到新的综合指标称为公因子,这些主成分不仅保留了原始指标的绝大多数信息,并且彼此不相关。利用因子得分计算 出每个评价对象的
6、综合得分,并以此作为综合评价的依据。因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量本文采用因子分析方法,将10个变量抽象为少数几个抽象的因子,那么前提是指标体系中的10个指标有一定的相关性。由指标相关系数矩阵可以得出指标间存在很强的相关性,故因子分析是可行的,也是有意义的。(一)SPSS软件运行结果及分析1、描述性统计量表 表2-1上面的表格显示了出场、出场时间、进球、助攻等10个指标的描述性统计量,如均值、标准化方差等,这为以后进行因子分析提供了一个直观地分析结果。从上表中可以看出,出场时间、射门、射正和犯规所占的比重是最大的,出场、进球、助
7、攻、越位、黄牌和角球所占的比重较低。2、因子分析共同度 表2-2该表显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,均为1(原始变量标准化后的方差为1)。事实上,因子个数小于原有变量的个数才是因子分析的目的。所以,第二列列出了按指定提取条件提取特征值的共同度。可以看到,所有变量的绝大部分信息可被因子解释,因此本次因子提取的总体效果是比较理想的。3、因子分析的总方差解释 表2-3该表显示的是因子分析的总方差解释,是相关系数矩阵的特征值、方差贡献率及累计方差贡献率的计算结果。可以看到,第一个因子的特征值是5.178,解释了原有10个变量总方差的51.776%;前三个因子的累计方差
8、贡献率为81.642%,并且只有它们的特征值大于1,说明前三个公因子基本包含了全部变量的主要信息,因此选取前三个因子为主因子即可。同时,“Extraction Sums of Squared Loadings”和“Rotation Sums of Squared Loadings ”这两列分别列出了因子提取后和旋转后的因子方差解释情况。从表中可以看到,它们都选择三个公因子。我们把这三个公因子分别表示为F1、F2和F3。4、旋转前的因子载荷矩阵 表2-4该表显示了旋转前的因子载荷矩阵,它是因子分析的核心内容。通过载荷系数大小可以分析不同公共因子所反映的主要指标的区别。从结果看,大部分因子解释性较
9、好,但是仍有少部分指标解释能力较差,如黄牌在三个因子的载荷系数区别不大。因此,接着采用因子旋转的方法使得因子载荷系数向0或1两极分化,使大的载荷更大,小的载荷更小,这样结果更加具有可解释性。5、旋转后的因子载荷矩阵 表2-5由旋转后的因子载荷矩阵可以看出,第一公因子F1在射正、射门、角球、越位、进球、上的载荷都很大,其中射门、射正、进球是反映个人能力的指标,角球是反映球员的战略战术的指标,越位在一定程度上反映了球员的意识及反应能力。因此, F1为反映个人技术能力及球场意识的公共因子,可以将其命名为个人技术能力及球场意识因子。第二公因子F2在犯规、出场时间及出场次数上载荷较大,在此因子上的得分反
10、映了球员的受重视程度,可以命名为受重视程度因子。第三公因子F3仅在助攻上有较大的载荷,助攻反映了球员的球场意识,可以命名为球员意识水平因子。6、因子得分系数矩阵 表2-6根据表中的内容,可以写出以下因子得分函数:F1=0.038X1-0.011X2+0.163X3-0.083X4+0.220X5+0.232X6-0.045X7+0.221X8-0.157X9+0.223X10F2=0.285X1+0.361X2-0.043X3+0.033X4-0.043X5-0.067X6+0.388X7-0.059X8+0.359X9-0.103X10F3=0.014X1+0.156X2+0.272X3+0
11、.805X4-0.050X5-0.054X6-0.190X7-0.179X8+0.107X9-0.062X10最后,计算出因子得分,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总得出各城市的综合得分F,即F=(F1*51.776+F2*18.466+F3*11.4)/81.6427、各个球员在每个公因子上的得分及综合得分如下表所示:球员F1F2F3F梅西36.382660.1074281.607211.6996c罗33.87629.1802267.857201.1914阿德里亚诺-3.391272.8942116.48875.83909比利亚14.376443.31881
12、82.984134.9388伊瓜因11.667349.7894143.514106.5547罗西14.854369.443150.243113.9608卡卡2.146263.0016112.18676.51233洛伦特6.011555.6254223.098160.6369哈维-5.834540.777234.964151.4235厄齐尔-3.898483.8834203.695135.4167莱昂0.64393.47638.48726.92452尼尔马-1.572216.88290.39560.68022赫迪拉-5.61337.957141.49292.63932蒂亚戈-3.656234.7492.89263.74641皮克-6.733244.1984101.72465.1676马塞洛
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1