医药数理统计习题答案.docx
《医药数理统计习题答案.docx》由会员分享,可在线阅读,更多相关《医药数理统计习题答案.docx(153页珍藏版)》请在冰豆网上搜索。
医药数理统计习题答案
第一章数据的描述和整理
、学习目的和要求
1.掌握数据的类型及特性;
2.掌握定性和定量数据的整理步骤、显示方法;
3.掌握描述数据分布的集中趋势、离散程度和分布形状的常用统计量;
4.能理解并熟练掌握样本均值、样本方差的计算;
5.了解统计图形和统计表的表示及意义;
6.了解用Excel软件进行统计作图、频数分布表与直方图生成、统计量的计算
内容提要
(一)数据的分类
数据类型
定性数据(品质数据)
定量数据
疋类数据
(计数数
据)
定序数据
(等级数
据)
数值数据
(计量数据)
表现形式
类别
(无序)
类别
(有序)
数值
(+—X+)
对应变量
疋类变量
定序变量
数值变量
(离散变量、连续变量)
主要统计方法
计算各组频数,进行列联表
分析、%检验等非参数方法
计算各种统计量,
和检验、回归分析
参数方法
进行参数估计
、方差分析等
常用统计图形
条形图,圆形图(饼图)
直方图,折线图,散点图,
茎叶图,箱形图
(二)常用统计量
1、描述集中趋势的统计量
名称
公式(原始数据)
公式(分组数
据)
意义
均值
x
-1n
X=—瓦Xi
ni二
-1k
x常一壬mifi
ni仝
反映数据取值的平均水平,是描述数据分布集中趋势的最主要测度值,
中位数
Me
Me=*
xn+,当n为奇数
(才
1
尹心+X(M),当n为偶数
22
中位数所在组:
累积频数超过n/2
的那个最低组
是典型的位置平均数,
不受极端值的影响
众数
Mo
数据中出现次数最多的观察值
众数所在组:
频数最大的组
测度定性数据集中趋
势,对于定量数据意义
不大
2、描述离散程度的统计量
名称公式(原始数据)公式(分组数据)意义
极差
R
R-最大值-最小值
R~最高组上限值—
最低组下限值
反映离散程度的最简单测度值,
不能反映中间数据的离散性
总体方差
2
21X.、2
CT=—工(Xi-X)
Ni4
1k
er2牝一送(mi—x)2fiNi_l
反映每个总体数据偏离其总体均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲
总体标准差
a
a=r
二
肱以-X)2
Ni-X
cr=Vc?
~
J1N2
吋Ngmi-x)fi
样本方差
S2
An
5_1十2
1k
S2——z(miX)2fin—1i土
反映每个样本数据偏离其样本均值的平均程度,是离散程度的最重要测度值,其中标准差具有与观察值数据相同的量纲
样本标准差
S
S=
H
1'-2—Z(Xi—x)n—i±
/1'_2=、兀(mi-x)fi
n—1y
变异系数
CV
S
CV-——X100%|X|
反映数据偏离其均值的相对偏差,是无量纲的相对变异性测度
样本标准误
Sx
反映样本均值偏离总体均值的平
均程度,在用样本均值估计总体
均值时测度偏差
3、描述分布形状的统计量
名称
公式(原始数据)
公式(分组数据)
意义
偏度
cn£(Xi—X)3
Sk—3
k
为(mi-x)3fi
C一i±
反映数据分布的非对称性
Sk
(n-1)(n-2)S
Sk_c3
nS
Sk-0时为对称;
Sk>0时为正偏或右偏;
Sk<0时为负偏或左偏
峰度
n(n1)、区—x)4一3['化x)2]2(n一1)
(n—1)(n—2)(n—3)S4
(原始数据)
k
E(m-x)4fi
Ku=4-3(分组数据)
nS
反映数据分布的平峰或尖
峰程度
Ku=0时为标准正态;
Ku>0时为尖峰分布;
Kuv0时为扁平分布
在分组数据公式中,mi,fi分别为各组的组中值和观察值出现的频数
三、综合例题解析
例1•证明:
各数据观察值与其均值之差的平方和(称为离差平方和)最小,
即对任意常数C,有
nn
_22
'(X-X)辽'(x-C)
i=1i=1
n
证一:
设f(c)=為(x-c2
i=1
由函数极值的求法,对上式求导数,得
nn
f(C)=-2、(x—C)=-2、x2nc,f(C)=2n
1id
令f(C)=o,得唯一驻点
1n
C=丄'Xj=x
nim
由于f(x)=2n0,故当c二X时f(C)y有最小值,其最小值为
n
f(X)八(Xi-x)。
i=1
证二:
因为对任意常数C有
nnnnn
'(肖—X)2-'(Xj—C)2-'x2-nX2—('Xj2—2C'xinC2)
i=4i4i=1i=1i=4
n
--nx22C'人-nC2--n(X2-2CXC2)
i=4
2
=-n(X-C)
nn
_22
故有(Xi-X)八(Xi-C)0
idi二
四、习题一解答
1.在某药合成过程中,测得的转化率(%)如下:
94.3
92.8
92.7
92.6
93.3
92.9
91.8
92.4
93.4
92.6
92.2
93.0
92.9
92.2
92.4
92.2
92.8
92.4
93.9
92.0
93.5
93.6
93.0
93.0
93.4
94.2
92.8
93.2
92.2
91.8
92.5
93.6
93.9
92.4
91.8
93.8
93.6
92.1
92.0
90.8
(1)取组距为0.5,最低组下限为90.5,试作出频数分布表;
转化率的频数分布表
转化率分组
频数
频率
累积频率
90.5〜
1
0.025
0.025
91.0〜
0
0.00
0.025
91.5〜
3
0.075
0.10
92.0〜
11
0.275
0.375
92.5〜
9
0.225
0.60
93.0〜
7
0.175
0.775
93.5〜
7
0.175
0.95
94.0〜94.5
2
0.05
1.00
(2)频数直方图:
直方图
转化率
频率折线图:
(3)
S2
转化率频率折线图
转化率
由频数分布表可得
转化率分组
组中值
频数
m,
90.5〜
90.75
1
91.0〜
91.25
0
91.5〜
91.75
3
92.0〜
92.25
11
92.5〜
92.75
9
93.0〜
93.25
7
93.5〜
93.75
7
94.0〜94.5
94.25
2
90.75191
.250
94
.252
40
3713=92.825
40
18_
(m,-x)2f,n-1ii
=—[(90.75-92.825)2X1+(91.25-92.825)2X0+…+04.25-92.825)2X2]39
=0.584
或者S2
一('fi—nx2)
n—'1i二
需(90.7521g20
94.2522-4092.762)=0.584
S二拓S2=0.584"0.7642
2.测得10名接触某种病毒的工人的白细胞(109/L)如下:
7.1,6.5,7.4,6.35,6.8,7.25,6.6,7.8,6.0,5.95
(1)计算其样本均值、方差、标准差、标准误和变异系数
(2)求出该组数据对应的标准化值;
(3)计算其偏度
10
解:
(1)'Xj=7.16.55.95二67.75,n=10
iA
10
'Xj2=7.126.52x川5.952=462.35
i吕
-1n6775
样本均值"礼“千厂®75
n
2[2—2I2
方差S2CX-nx2)(462.35-106.7752)=0.371
n—1y9
标准差S=tS2=0.371"0.609
标准误Sx二
S
0.609
.40
=0.193
s0.609
变异系数CV=—100%=100%=8.99%;
|x|6.775
(2)对应的标准化值公式为
Xj-xXi-6.775Ui
S0.609
对应的标准化值为
0.534,-0.452,1.026,-0.698,0.041,0.78,-0.287,1.683,-1.273,-1.355
(3)
=0.204
n'(Xj_X)3
(n_1)(n_2)S3
3.已知某年某城市居民家庭月人均支出分组数据如下表所示
按月人均支出分组(元)家庭户数占总户数的比例(%)
200以下
1.5
200〜
18.2
500〜
46.8
800〜
25.3
1000以上
8.2
合计
100
试计算
(1)该市平均每户月人均支出的均值和标准差;
(2)并指出其月人均支出的中位数与众数所在组。
解:
(1)由原分组数据表可得
支出分组(元)组中值比例(%)
200以下
100
1.5
200〜
350
18.2
500〜
650
46.8
800〜
900
25.3
1000以上
1100
8.2
mifi
1
100
(1001.535018.2卷…川11008.2)687.3
('n-1i占
mi2fi
-nx2)
12222
—(1001.535018.2川…川11008.2-5687.3)
99
=52468.39
S=S2=,52468.39=229.06;
(2)由原分组数据表可得
支出分组(元)
比例(%)
累积比例(%)
200以下
1.5
1.5
200〜
18.2
19.7
500〜
46.8
66.5
800〜
25.3
91.8
1000以上
8.2
100
中位数所在组,即累积比例超过50的那个最低组,即为500〜组
众数所在组是频数即比例最大的组,也是500〜组。
4.设X1,X2,…,Xn和yi,讨2,…,yn为两组样本观察值,它们有下列关系:
Xi-a
yiF
其中a、b为常数且
解:
y=
ny
b工0,求样本均值X与y及样本方差S;和S2之间的关系。
y「・Xi-哩)=亠
S;
-y)2
n
1x-x-ax-a2()n-1ijbb
丄J(口)2
n—1vb
nybbnynb
n
b2
(Xj-X)
1丄'n-1ii
五、思考与练