数据分析练习题(解答).doc
《数据分析练习题(解答).doc》由会员分享,可在线阅读,更多相关《数据分析练习题(解答).doc(3页珍藏版)》请在冰豆网上搜索。
EX1-0
设来自样本观测值如下表:
x
68
63
70
6
65
9
10
12
y
971
892
1125
82
931
112
162
321
求2维总体(X,Y)T各分量的秩统计量。
EX1-1某小学10名11岁学生的身高(单位:
cm)数据如下:
身高
147
138
140
132
126
131
139
142
138
145
(1)计算均值、方差、标准差、变异系数、偏度、峰度;
(2)计算中位数、上、下四分位数、四分位极差、三均数;
(3)作出直方图(范围130~145,ai-1≤x(4)作出茎叶图;
(5)写出次序统计量;
(6)进行正态性W检验(适合与小样本3<=n<=50)。
需要计算,试写出(其中,当n为偶数时,;当n为奇数时,)
解:
(1)
均值:
;
方差:
;标准差;
变异系数:
;
偏度:
;
峰度:
。
(2)
中位数:
;
上、下四分位数:
,;
四分位极差:
;
三均数:
。
EX1-42002年11月以及1至11月全国部分省、市、区财政预算收入数据如表1.4所示(单位:
亿元)。
设X1为11月预算收入,X2为1至11月预算收入,分别对X1,X2的观测值计算:
(7)X1,X2的观测值的Pearson相关系数Spearman相关系数。
Pearson相关系数:
其中,,。
Spearman相关系数:
,
其中为的秩统计量,为的秩统计量。
例2-1,2-2对于只有一个自变量的线性回归模型,利用观测值
(1)求β0,β1的最小二乘估计及的估计,其中xi不完全相同。
(2)当回归模型为时,它的最小二乘估计是否为β的无偏估计?
(3)求X的一个新观测值x0处因变量Y预测值y0的置信度区间。
(4)求置信区间长度最小的x0取值?
解:
(1)参考书中例2-1
由可得
,
(2)
由回归模型
其中,
,即
设xi不全为0,则最小二乘估计是
因为故确实是的最小值点。
由
(1)
所以,它的最小二乘估计是β的无偏估计。
(3)参考书中的例2-2
对于给定置信水平,由
式,可得Y在处取值y0的置信度为1-的置信区间为
所以新观测值处取值y0的置信度为1-的置信区间为:
其中,。
。
(4)由上式可知,置信区间的长度在x0=时达到最小,为
。
3