统计学案例分析Word格式.docx
《统计学案例分析Word格式.docx》由会员分享,可在线阅读,更多相关《统计学案例分析Word格式.docx(10页珍藏版)》请在冰豆网上搜索。
青春期是指人体从童年向成年过渡的人生关键时期。
青春期不仅身体增长快,而且人体各器官特别是生殖器官的发育逐渐趋向成熟。
随着青春期生理的变化,青少年的心理也同时发生了相应的变化,如:
认识到自已不再是小孩子了,喜欢独立行事,喜欢交友往来,性意识开始萌发,对异性产生好奇、兴趣。
这时的少男少女,往往憧憬着新的生命历程,
-10-
内心世界与来自社会的外部环境常常发生矛盾冲突,面临着人生课题的许许多多疑问和困惑。
因此,正处在告别童年、开始步入青春期的中学生,怎样顺利度过青春期而健康成长,这是青少年本人、父母和教师都必需认真对待的问题。
怎样才算青春期适应良好呢?
一些心理学者通过研究,提出了标准,中学生可以根据这些标准进行自我鉴定。
通过专业的量表进行认真的测试,才能得到真正对自己的了解。
因此,我组通过分发样表的方式进行测试,并总结分数,对数据进行分析,通过分数确定其适应社会的具体程度,从而了解当今青少年的心理缺陷。
数据采集
我国青少年的青春期年龄,一般是在10岁到20岁这段时间,中学生正处于这一时期。
依据统计学理论,从临安青少年这个大群体(总体)中抽取30人(样本)进行研究,通过路边随机发放问卷测试的方法来进行数据的采集。
数据获得方法
通过对这30人进行专业的心理测试,通过提问回答“是”或者“不是”进行给分,收集数据算出得到的总分。
再将其进行分类。
得到是否适应的结论。
通过统计学的基本方法
进行数据分析。
数据量的确定
由于临安的青少年这个总体过大庞大,所以从中抽取一定量,样本容量确定为30个青
少年,通过随机抽取的方法获得样本。
合理性
样本可以看作是重复试验的结果的集合。
随机试验i产生一个与随机变量Xi相对应的结果(一个具体的数),其中x的下标i与试验i相对应。
随机变量的集合与含有N个观察值[x1,x2,x3,…,xN]的样本
假设样本个体为X:
所有的X都独立。
本被用来估计随机变量的分布特性或对不同变量之间的相互关系做出推论。
有时候假设样本是从一个较大的总体中抽取得到的(这个总体可以是实际存在的,也可以是假想的)。
经过初步统计得出以下数据:
随机抽样调查结果(30个样本)
序号
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
得分
24
25
34
40
26
35
29
28
31
22
性别
男
女
16
17
18
19
20
21
23
27
30
33
32
36
对上表所示数据以性别为类别,进行初步统计分析。
将得分分为5组,大于或等于36
分的定为对心理转折适应非常好;
29—35分定为适应良好;
24—28分定为尚能适应;
16—
23分定为适应不良;
小于或等于15分的定为严重适应不良。
30个样本的频数分布表
组别
总
≥36
29—35
24—28
16—23
≤15
人数
画出男、女人数分布情况的条形图:
30个样本的相对频数分布表
0.0667
0.1333
0.1
0.4667
0.6667
0.5667
0.2
0.3333
男生人数分布情况条形图
>
36 29-35 24-28 <
<
女生人数分布情况条形图
计算出男生样本、女生样本、总体样本得分的均值、方差和标准差:
å
Ci
Samplemeanofboys:
C=
n
=30.4
Samplemeanofgirls:
i
C
Samplemean:
å
=30.77
=31.13
Samplevarianceofboys:
s2
Samplevarianceofgirls:
=å
(xi-x)
n-1
=å
=21.26
=10.04
Samplevariance:
=12.7
s2
Samplestandarddeviationofboys:
s= =4.61
Samplestandarddeviationofgirls:
s= =3.23
Samplestandarddeviation:
s= =3.56
基于以上运算结果,或许会有出现异常数据的可能,由此,我们决定运用计算Z分数来检测异常值:
z-score:
z=xi-x
i s
(standardizedvalue)
30个样本的Z分数值
Z分数
-1.9
-1.62
0.91
2.59
-1.34
1.19
-0.50
-0.5
-0.78
0.06
-2.46
-1.06
0.63
0.35
1.46
-0.22
-0.34
1.47
可以看出,所有观测值的都在偏离平均数的3倍范围之内,得出结论:
所有数据值都属于该数据集,都是正确的,无异常值的存在。
我们有一项研究任务是分析男女学生转变的差异,根据以上对平均数、方差、标准差的计算,初步得出女生较男生有较好的适应性水平。
但这只是对数据表面的分析,由此我们要运用协方差和相关系数来分析两者的线性关系。
将男女学生分成两组,得到男生组数据和女生组数据。
40-24=16
range
36-25=11
30.4
average
31.13
media
26,34
mode
21.26
方差
10.41
4.61
标准差
3.23
Samplecovariance:
sxy=
(xi-x)(yi-y)n-1
sxy
rangeaveragemediamode方差
=6.56
s
Correlationcoefficient:
rxy=
xsy
=0.44
Theruleofris:
1.Measurestherelativestrengthofthelinearrelationshipbetweentwovariables(boysandgirls).
2.Thecloserto–1,thestrongerthenegativelinearrelationship.
3.Thecloserto1,thestrongerthepositivelinearrelationship.
4.Thecloserto0,theweakerthelinearrelationship.
Here,requalsto0.44,thatmeansthereislinearrelationshipbetweenboysandgirls,anditalmostamidin0-1,soitisalitmuslesslinearrelationship.
FindingProbabilities:
when it isdistributednormallyTotalmeanis30.77