ImageVerifierCode 换一换
格式:DOCX , 页数:23 ,大小:121KB ,
资源ID:30181087      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/30181087.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(经典的统计学分析报告 恋爱和单身.docx)为本站会员(b****5)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

经典的统计学分析报告 恋爱和单身.docx

1、经典的统计学分析报告 恋爱和单身话说呢,这其实是我们概统小组(褚君、刘畅、韩冰、李铖)的小组作业,应广大人民同志的要求,特意发上来特别鸣谢:褚君、刘畅两位技术大牛!没有你们就没有这篇惊天地泣鬼神的报告!有木有!还有冰哥!起人来灰常给力!一、问题提出从古到今,青年男女的恋爱总是大家评论的热门话题。在中国古代,青年男女秉承父母之命、媒妁之言,通过媒婆相互共同,最终达成秦晋之好。时至今日,社会风气自由开放,人们更加推崇给予当事人更大自主权的“婚姻自由,恋爱自由”之原则。因此,选择伴侣的过程由一家之言逐渐演化成为多因素共同决定、相互影响的过程。具体到大学生而言,由于绝大部分大学生基本已步入成年,对选择

2、伴侣一事已具有一定的自主权与自由,如何能找到最佳的伴侣也成为不少大学生,尤其是男生所考虑的一件事。而对于究竟何种特质左右着男生“脱光”与否一事,则是仁者见仁,智者见智。因此,基于以上现状,我们觉得有必要影响对大学男生“脱光”的特质进行探究,以为广大寄希望于在大学生活中收获美满爱情的男生提供具有一定价值与说服力的指导。二、研究设计(一)实验变量在进行待探究变量的选取时,我们从个人基本信息、生活习惯及恋爱预期三个方面出发进行变量的筛选,其中囊括了连续变量与离散变量,具体如下。1.连续变量:身高(cm) 体重(kg) 当前平均绩点 意愿为恋爱活动花费的金额上限2.离散变量:年级、现在恋爱状态(是或否

3、)、是否具有恋爱经历(是或否)、进入大学的途径(正常高考、竞赛保送、自主招生)、每周花费在课程学习上的小时数(分段计量)、每周花费在社团活动方面的小时数(分段计量)、在电子游戏方面花费的小时数(分段计量)、各类社交网络方面花费的小时数(分段计量)、每周洗澡的次数 每学期剪发的次数、平均每餐饭需要的米饭量、体质健康测试的成绩、思想道德修养与法律基础总评成绩、平均每月所需的生活费(分段计量)(二)问卷研究1.问卷目的:充分收集现象,为对总体进行估计提供基础。2.问卷设计问卷主要由三部分构成:其一,向被调查者说明本组研究目的,并向其承诺问卷调查结果将被严格保密。其二,个人信息部分,针对被调查者个人的

4、基本状况的调查部分。其三,主要问题部分,针对被调查者对于各问题偏好的调查部分。3.问卷测试、发放与回收在正式发放问卷之前,我们首先打印了15份纸质版问卷在私下进行小范围的发放,通过被调查者的反馈与建议,我们对问卷中的措辞及选项设计的不当进行了更正。正式问卷的发放采用专业的问卷网站“问卷星”进行。问卷发放采取在人人网等社交网站平台上对符合条件的被调查者(男生)进行邀请的方法。据统计,本组问卷页面的访问人次达到449次(其中独立IP数为262),最终有效答卷为137份,完成率为30.51%。三、数据统计与分析(一)统计结果描述1.性别分布由于本研究针对男生进行,因此本次问卷回答者均为男性。2.年级

5、分布本次接受调查者普遍为本科全日制在校大学生(除两人为研究生),其中,各年级人数分布如下:Figure 1 年级分布由上图可以看出,本次调查中大二年级的同学占绝大多数,达51.2%,其次为大一同学,占23.36%,大三与大四同学分别占到14.6%与9.49%,本科以上学历者仅占到1.46%。3.现在所处感情状态与感情经历Figure 2 目前感情状态Figure 3 感情经历由上图可以看出,在本次的被调查人群中,目前无伴侣者约占到总人数的3/4,而有伴侣者仅占到1/4。在目前无伴侣的调查者中,约1/2(总样本的3/8)的调查者曾有过感情经历,而另外1/2(总样本的3/8)还未曾有过感情经历。4

6、.入学途径Figure 4 入学途径在关于入学途径的调查中,通过普通高考进入大学的被调查者占绝大多数,达到67.15%;其次为自主招生,占到19.71%;竞赛保送的同学占到13.14%。5.身高本次被调查者的总体身高分布情况,及对应正态分布图线如上图所示。据统计,本次调查中,被调查者身高的样本均值为175.86cm,标准差为5.38。其中,中位数为176cm,众数为170cm,最大值与最小值分别为192cm与160cm。6.体重本次被调查者总体体重分布情况,及正态分布图线如上图所示据统计,本次调查中,被调查者体重的样本均值为66.56kg,标准差为8.01。其中,中位数与众数均为65kg,最大

7、值与最小值分别为87kg与50kg。7.平均绩点本次被调查者总体绩点分布情况,及正态分布图线如上图所示(由于被调查人群中大一年级同学尚未得知其平均绩点,因此仅选择了非大一年级同学的剩余92份调查结果)据统计,本次调查中,被调查者体重的样本均值为3.33,标准差为0.31。其中,中位数为3.37,众数为3.25,最大值与最小值分别为3.85与2.39。(二)交叉分析1.年级与平均身高方差分析:单因素方差分析(年级对于平均身高的影响) SUMMARY 组(年级)观测数求和平均方差4122117176.416726.628793193351176.368436.8011726110564.72173

8、.1921527.75981315429175.12926.31613方差分析 差异源SSdfMSFP-valueF crit组间226.9944375.664810.26950.847282.680811组内33410.41119280.7597总计33637.4122以上为通过ANOVA法,对获得的身高值与所在年级的数据处理之后的结果。我们发现,观测到的数据的p-value=0.84728,非常大,因此我们可以认为,原假设“1=2=3=4”可以被接受。这个同样可以通过F值的比较看出来。由上表我们看出,在=0.05的条件下,F3,119,0.05=2.680811,而观测到的F值为0.269

9、5,远小于前者,因此我们同样可以得出结论,原假设应当被接受。所以,我们得出结论,年级对于男生的身高没有很大的影响。2. 年级与平均体重的影响方差分析:单因素方差分析(年级对于平均体重的影响) SUMMARY 组(年级)观测数求和平均方差41280967.4166768.08333319124965.7368444.64912261407866.8524665.3362131205166.1612977.47312方差分析 差异源SSdfMSFP-valueF crit组间31.82613310.608710.1619140.9217862.680811组内7796.96711965.52073

10、总计7828.793122同样的,P-value 明显高于显著性水平,因此我们得出结论:年级对于男生的体重没有显著影响。3.出生地与绩点方差分析:单因素方差分析(地域对于绩点的影响) SUMMARY 组(地区)观测数求和平均方差11756.993.3523530.042132276250.343.2939470.163931方差分析 差异源SSdfMSFP-valueF crit组间0.0473910.047390.3325260.5655993.945694组内12.96892910.142516总计13.0163192类似的,我们做出了不同地域的同学的平均绩点的差异比较。组1是来自一线城市

11、的同学的数据,组2是来自其他地区城市的同学的相应数据。我们在本次研究中把“一线城市”定义为:北京,上海,广州,重庆,天津,香港,台北。通过ANOVA表我们看出,“一线城市”同学的平均绩点要比其他城市同学的要稍微高一点点,可是差别并不显著,因为P-value也较大。因此我们认为,来自不同地区的同学的成绩并不存在显著的差异。4.身高与体重SUMMARY OUTPUT 回归统计 Multiple R0.568158R Square0.322804Adjusted R Square0.317207标准误差6.614726观测值123方差分析 dfSSMSFSignificance F回归分析12523

12、.6732523.67357.67797.18273E-12残差1215294.30643.7546总计1227817.98Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept-81.794319.54877-4.184115.45E-05-120.4962165-43.0923height0.8436650.1110887.5945977.18E-120.623738061.063592由上表及残差图我们可以看出,由回归得出的0以及1的P-value的值都很小,说明身高与体重是具有显著的线性相关关系的。F检验的显著性水平和残差图都让

13、我们相信,这个回归模型是可行且有效的。因此,该结果检验了一个大家公认的道理,体重与身高水平间是具有明显的相关性的。(三)针对影响脱光与否的变量的探究1.样本数据的整理由于大一新生缺乏体侧和GPA等数据,而我们推测这些数据应该与是否脱光有一定联系,所以做出了两个样本,Sample1包含大二至大四的93位同学的数据,包括体测与GPA等数据,Sample2包括大一到大四所有有效问卷的所有变量数据。由于问卷设计的问题,对于恋爱史这个问题的回答,如果已经脱光的人这个问题就直接跳转了,所以所有已经脱光的同学的第三题回答都是“跳过”,造成做Logistic回归时,百分百匹配的错误结果。2.logistic回

14、归模型理论回顾及应用1)Logistic 回归理论:Logistic回归模型是一种概率模型,适合于病例对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。令: y=1 发病(阳性、死亡、治愈等),y=0 未发病(阴性、生存、未治愈等)发病的概率记为P,它与自变量x1, x2,xp之间的Logistic回归模型为:可知,不发病的概率为:经数学变换得:定义:Logistic变换即为:流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露人群发病优势与非暴露人群发病优势之比。即Xi的优势比为:2

15、)Logistic回归模型在本研究中的应用A. Sample1分析:l 变量说明y(因变量) 是否脱光x1入学途径x2眼镜度数x3身高x4体重x5出生地城市等级x6填写问卷所用时间x7年级x8学习时间x9社交活动时间x10游戏时间x11社交网络时间x12每周洗澡次数x13每学期剪发次数x14每餐饭饭量x15月平均生活费x16恋爱活动花销上限l Logistic regression Number of obs =127LR chi2(15) =4.90Prob chi2 =0.9930 Log likelihood = -71.335948Pseudo R2 = 0.0332y Odds Ra

16、tio Std. Err. z P|z| 95% Conf. Interval x1 0.9993960.2742700.9980.5836291.711347x2 0.9997290.000877-0.310.7570.9980121.001448x3 1.0196690.0403220.490.6220.9436241.101842x4 1.0120960.0313980.390.6980.9523911.075545x5 0.8370970.519101-0.290.7740.2482722.82243x7 1.0944330.2657860.370.710.6799431.761592

17、x8 0.9203060.158984-0.480.6310.6559731.291156x9 1.1142030.1676490.720.4720.8296371.496374x10 1.0813070.1586820.530.5940.8110261.441661x11 1.0135380.1504950.090.9280.7576171.35591x12 0.9365430.229368-0.270.7890.579511.513544x13 1.1911930.3723590.560.5760.6455092.198174x14 1.1404320.3808870.390.6940.5

18、926262.194611x15 1.0417150.2376150.180.8580.6661781.628951x16 1.0001070.00030.360.7210.9995191.000695Sample1的伪R方很低,说明模型对数据的解释程度很小,没有发现显著的相关性。B. Sample 2分析l 变量说明Y(因变量)是否脱光x1入学途径x2眼镜度数x3身高x4体重x5出生地城市等级x6平均绩点x7学习时间x8社团活动时间x9游戏时间x10社交网络时间x11每周洗澡次数x12每学期剪发次数x13每餐饭饭量x14体质健康测试成绩x15思想品德修养成绩x16月平均生活费x17恋爱活动花

19、销上限x18填写问卷所用时间x19年级l Logistic regressionNumber of obs =93LR chi2(19) =19.76Prob chi2 =0.4091Log likelihood =-44.253338Pseudo R2 = 0.1825y Odds Ratio Std. Err. z P|z| 95% Conf. Interval x1 0.7590950.319925-0.650.5130.3323171.733965x2 0.9983950.001208-1.330.1840.9960311.000764x3 1.0085570.0287560.30.7

20、650.9537431.066522x4 0.9938130.040715-0.150.880.9171331.076905x5 1.3034680.9582470.360.7180.3085595.506333x6 10.4396213.14991.860.0630.884094123.2738x7 0.6775430.18384-1.430.1510.3980871.153176x8 0.9606360.193426-0.20.8420.6473931.425442x9 1.3483980.2638971.530.1270.9188151.978828x10 0.9448030.19606

21、5-0.270.7840.6290721.418997x11 1.8301840.6927751.60.110.8715493.843243x12 0.8635240.385489-0.330.7420.3599872.071391x13 0.8629810.35367-0.360.7190.3865081.92683x14 1.0142080.0258020.550.5790.9648771.066061x15 0.976470.049797-0.470.6410.8835891.079113x16 0.8709350.31608-0.380.7030.4276291.773797x17 0

22、.9993150.000541-1.270.2060.9982551.000376x18 0.9904830.004934-1.920.0550.980861.000201x19 1.0429270.4016480.110.9130.4902782.218532C.回归结果分析观察伪R方,为0.1825,因为是取实际数据而且对于总的人口来说,大小为93的样本略小,所以模型拟合度较低也是在接受范围之内。观察P值,可以发现x6和x18是显著的,分别代表GPA和填写问卷用时,他们的Odds Ratio均为正,分别是10.43962和.9904828,Odds ratio代表的是自变量对因变量变化率的

23、关联程度,由此我们发现相比于其他的变量GPA显著与是否脱光具有正相关性,但是由于不清楚因果顺序,我们并不能断定是“是否脱光”导致高GPA,还是高GPA导致了更容易脱光。对于填写问卷时间,这里由于不是所有人都填写了这份问卷,所以这个变量的说明性不强,但是我们可以做出假设填写问卷的时间有可能反映了这个人的耐心程度,一定程度上是个人特质的反映。所以也和是否脱光有正相关。我们删掉变量x18(即问卷填写用时)后,重新对Sample2进行logistic回归:l Logistic regressionNumber of obs =93LR chi2(19) =15.26Prob chi2 =0.6439L

24、og likelihood =-46.502035Pseudo R2 = 0.1410y Odds Ratio Std. Err. z P|z| 95% Conf. Interval x1 0.9665670.389683-0.080.9330.4385912.13012x2 0.9985520.001221-1.180.2360.9961631.000948x3 1.0043750.0239020.180.8540.9586041.052332x4 1.0003380.0397110.010.9930.9254561.081279x5 1.1189680.7623850.160.8690.2943544.253692x6 9.87541411.592491.950.0510.98935598.57315x7 0.6573450.171125-1.610.1070.3946411.094927x8 0.9884150.188748-0.060.9510.6798191.437095x9 1.2478210.2318371.190.2330.8669711.795973x10 0.9987270.200802-0.010.9950.6734511.481112x11 1.9947010.7298491.890.0590.9737074.086274x1

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1