统计学原理及实务徐静霞.docx
《统计学原理及实务徐静霞.docx》由会员分享,可在线阅读,更多相关《统计学原理及实务徐静霞.docx(26页珍藏版)》请在冰豆网上搜索。
统计学原理及实务徐静霞
思考与练习
一、思考题
1、分类数据的图示方法,其中包括条形图、Pareto图、比照条形图和饼图等。
顺序数据除了上文提到的条形图、pareto图、比照条形图、饼图之外还可以借助累积频数分布图和环形图来进展描述。
2、条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维散点图、气泡图、雷达图等。
3、数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。
根据组距不同还可以分为等距分组和不等距分组。
4、分组和编制频数分布表的具体步骤如下:
第1步:
排序。
将变量按照一定的大小顺序进展排序,通常是由小至大的递增顺序,使用计算机软件进展整理时此步可以忽略。
第2步:
确定组数。
一般与数据本身的特点及数据的多少有关。
由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。
如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。
组数确实定应以能够显示数据的分布特征和规律为目的。
一般情况下,一组数据所分的组数K不应少于5组且不多于15组,即5<K<15。
在实际分组时,也可以借助经历公式来确定组数K,
其中n为数据的个数,对结果四舍五入取整数即为组数。
第3步:
确定各组的组距。
在组距分组中,一个组的最小值称为下限〔lowlimit〕;一个组的最大值称为上限〔upperlimit〕,组距〔classwidth〕是一个组的上限与下限的差。
组距可根据全部数据的最大值和最小值及所分的组数来确定,即,
组距=〔最大值—最小值〕/组数。
5、饼图是用圆形及圆扇形的角度来表示数值大小的图形,它主要用于表示一个样本〔或总体〕中各组成局部的数据占全部数据的比例,对于研究构造性问题十分有用。
环形图中间有一个“空洞〞,样本或总体中的每一局部数据用环中的一段表示。
饼图只能显示一个总体和样本各局部所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。
因此环形图可显示多个总体或样本各局部所占的相应比例,从而有利于进展比拟研究。
6、直方图与条形图是不同的,首先,条形图是用条形的长度〔横置时〕表示各类别频数的多少,其宽度〔表示类别〕则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
7、茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保存了原始数据的信息。
而直方图虽然能很好地显示数据的分布,但不能保存原始的数值。
在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。
8、统计图一般由下面几个局部构成:
〔1〕标题,即图的名称,简明扼要说明资料的中心容,必要时注明时间和地点,一般写在图的正下方位置,同时将图形的编号写在标题的前面。
〔2〕标目,分为纵标目与横标目,分别表示纵轴与横轴数字刻度的意义,一般注明度量衡单位。
〔3〕点线条面,借以用来显示数据的元素,这是图形的主体局部,用于显示数据和展示数据的规律和关系。
〔4〕刻度,指在纵轴或横轴上的坐标。
〔5〕图例,其目的是为了使读者能区分统计图中各种图形的意义。
9、一般用“图优性〔Graphicale*cellency〕〞来描述一个好的统计图。
“图优性〞是指图形能够在最短的时间,用最少的笔墨,在最小的空间里,给观众最多的思想。
一好的图形应包括如下根本特性:
显示数据,集中反映图形的容,防止歪曲,数据之间可进展有效比拟,目的明确且唯一,统计描述和文字说明清晰。
10、常见的统计表一般由4个主要局部组成,即表头、行标题、列标题和数据,此外,必要时可以在统计表的下方加上表外附加说明。
11、在具体编制统计表时,应当遵循以下几点规则:
〔1〕统计表的构造要合理,容要简练,形式要美观。
比方行标题、列标题、数字资料的位置应安排合理。
如果有合计一项,一般放在最后一行或最后一列。
有时,由于强调的问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,防止出现过高或过长的表格形式。
〔2〕统计表一般使用“三线表〞的形式,如表3—24所示,表的上下两端横线一般用粗线条绘制,用细线把行标题和数字资料进展别离,统计表的左右两端不封口。
这样使人看起来清楚、醒目、美观。
如果数据关系复杂,单靠三条线是不够的,在这种情况下,数据资料也可用横线或竖线对数据资料进展分开,以说明数据的隶属关系,但必须用细线,总之表中尽量少用横竖线。
〔3〕表头一般应包括表号、总标题和表中数据的单位等容。
总标题应简明确切地概括出统计表的容,一般需要说明统计数据的时间〔When〕、地点〔Where〕以及何种数据〔What〕,即标题容应满足3W要求。
如果表中的全部数据都是同一计量单位,可放在表的右上角标明,假设各变量的计量单位不同,则应放在每个变量后或单列出一列标明。
〔4〕表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。
当数字因小可略而不计时,可写上“0〞;当缺*项数字资料时,可用符号“…〞表示;不应有数字时用符号“一〞表示,一填好的统计表不应出现空白单元格。
〔5〕在绘制统计表时,为保证统计资料的科学性与严肃性,在统计表下,应注明资料来源,以说明表中数据的可靠性,或是方便读者查阅使用。
必要时,也可在统计表下添加注解,以对变量或数据进展必要的解释和文字说明。
二、单项选择题
1-5CACCD6-10CBBBC11-15CDDBC
16-20CDDBB21-25BBBCB26-30ACABD
三、练习题
1、〔1〕属于顺序数据
〔2〕
计数项:
成绩
成绩
汇总
A
B
C
D
E
8
25
26
15
6
总计
80
〔3〕
成绩
人数
累计
频率
A
8
8
0.1
B
25
33
0.4125
C
26
59
0.7375
D
15
74
0.925
E
6
80
1
总计
80
80
1
〔4〕
2、
〔1〕
〔2〕正态分布
3、
〔1〕
接收
频率
累积%
接收
频率
累积%
49
5
10.00
79
15
30.00
59
5
20.00
89
11
52.00
69
10
40.00
69
10
72.00
79
15
70.00
49
5
82.00
89
11
92.00
59
5
92.00
99
4
100.00
99
4
100.00
合计
0
-
合计
0
-
〔2〕
〔3〕
VAR00001Stem-and-LeafPlot
FrequencyStem&Leaf
2.004.13
3.004.667
3.005.003
2.005.89
5.006.01144
5.006.57799
7.007.0001344
8.007.55666788
6.008.011344
5.008.57789
3.009.022
1.009.7
Stemwidth:
10.00
Eachleaf:
1case(s)
4、〔2〕
接收
频率%
累积%
接收
频率
累积%
69
4
4.00
99
11
22.00%
79
12
16.00
109
9
40.00%
89
16
32.00
89
8
56.00%
99
18
54.00
119
7
70.00%
109
16
72.00
79
6
82.00%
119
14
86.00
129
4
90.00%
129
8
94.00
69
2
94.00%
139
4
98.00
139
2
98.00%
149
2
100.00
其他
1
100.00%
100
——
〔3〕
VAR00004Stem-and-LeafPlot
FrequencyStem&Leaf
2.006.89
6.007.233566
8.008.01123456
11.009.
9.0010.002466678
7.0011.2355899
4.0012.4678
2.0013.24
1.0014.1
Stemwidth:
10.00
Eachleaf:
1case(s)
5、
〔1〕
VAR00003Stem-and-LeafPlot
FrequencyStem&Leaf
1.0011.6
2.0012.02
1.0012.8
2.0013.04
2.0013.56
2.0014.22
2.0014.78
.0015.
1.0015.5
2.0016.02
1.0016.8
4.0017.0233
Stemwidth:
100.00
Eachleaf:
1case(s)
6、
〔1〕
计数项:
时间
时间
汇总
7:
00
3
7:
30
4
8:
00
4
8:
30
7
9:
00
2
总计
20
〔2〕
7、
〔1〕、
〔2〕
8、
〔1〕
〔2〕
〔3〕
9、
〔1〕
接收
频率%
累积%
接收
频率%
累积%
29
10
10.00
20-30
5
10.00
39
16
26.00
30-40
8
26.00
49
12
38.00
40-50
6
38.00
59
16
64.00
50-60
13
64.00
69
20
84.00
60-70
10
84.00
79
12
96.00
70-80
6
96.00
89
4
100.00
80-90
2
100.00
合计
100
-
合计
100
-
〔2〕
〔3〕
10、
〔1〕
〔2〕
11、
〔1〕
〔2〕
〔3〕
第四章
二、单项选择题
1-5CADBD6-10BCBDD11-15BACCC
16-20BBBCD21-25CDACC26-28DAA
三、计算分析题
4.1〔1〕首先将数据由小到大进展排列,中位数的位置为,即排在第7位的数值为中位数,即民生银行的营业收入为中位数,350.17亿元。
平均数
〔2〕
即在第3个数值〔145.13〕和第4个数值〔176.11〕之间0.25的位置上,因此
〔亿元〕
即在第9个数值〔1295.31〕和第10个数值〔3340.37〕之间0.75的位置上,因此
〔亿元〕
〔3〕百分位数的位置
由于不是整数,百分位数的位置就是第个位置的数据的整数局部,则第30个百分位数是第4个数,即华夏银行的营业收入176.11亿元为第30个百分数。
〔4〕=1786.559〔亿元〕