统计学原理Word文档格式.docx
《统计学原理Word文档格式.docx》由会员分享,可在线阅读,更多相关《统计学原理Word文档格式.docx(22页珍藏版)》请在冰豆网上搜索。
2、试根据如下资料绘制茎叶图。
72、75、60、52、65、90、95、85、76、86
92、63、75、53、87、77、69、85、86、64
63、66、71、78、84、98、79、62、57、76
茎叶
5237
602334569
7125566789
8455667
90258
3、算术平均数、中位数和众数三者之间有何关系?
(1)如果数据的分布是对称的,则众数、中位数、和均值完全相等
(2)如果数据是左偏分布
(3)如果数据是右偏分布
(4)当数据分布的偏斜程度不是很大时,算术平均数到众数的距离是算术平均数到中位数距离的3倍。
即:
4、选择题
(1)不同数列的标准差不能简单进行对比,这是因为不同数列的(A,D)
A平均数不同B标准差不同C个体数不同D计量单位不同
(2)某居民区家庭人口数的分布资料如下:
家庭人口数(人)1234567
户数(户)10508060302010
该居民区家庭人口数的中位数是:
(C)
A130户B130.5户C3人D4人
(3)变量数列中出现次数最多的值是(D)
A算术平均数B调和平均数C中位数D众数
6、为了了解大学生每月生活费用支出情况,某省在全省高校中随机抽取了250名学生进行调查,调查得样本资料如下:
试计算:
(1)250名学生的平均生活费用月支出额;
(2)月生活费用的中位数和众数;
(3)月生活费用的标准差。
按月生活费支出分组(元)
人数(人)
x
Xf
150以下
150—200
350以上
20
110
90
125
175
225
275
325
375
1250
3500
24750
4875
1875
合计
250
61000
(1)=244
(2)中位数所在组200—250
(3)
7、某信息传呼台两名接线员5天中每天接呼次数资料如下:
A接线员12010876184165
B接线员94681135599
从日均次数的代表性和接线次数和日分布的均衡性角度作简要评价和分析。
B接线员日均次数的代表性较好
8、某投资银行的年利率按复利计算,10年的年利率分别是有一年为7%,有3年为8%,有四年为10%,有两年为11%,试求平均年利率。
平均年利率为9.29%
1、选择题
(1)要求估计量的数学期望等于被估计的总体指标的真值,称为(C)
A一致性B有效性C无偏性D充分性
(2)在不放回抽样下,样本均值得方差等于(c)
A
BS2C
D
(3)置信区间的长度越短,估计的精度则(a)。
A.越高B.越低C.与长短无关D.无法判定
(4)若
和
均为总体指标
的无偏估计量,下列哪种情况表示
比
更有效(c)
A
BVar(
)>
Var(
)
CVar(
)<
)DMSE(
)<
MSE(
2、影响样本容量的因素有哪些?
(1)总体中个体之间的差异程度。
即总体方差
。
总体方差越大,所需的样本容量越大;
反之,总体方差越小,所需的样本容量越小。
(2)允许误差
的大小。
允许误差越小,估计的精确度越高,则所需的样本容量越大;
反之,允许误差越大,估计的精确度越低,则所需的样本容量越小。
(3)估计的可靠性高低。
估计的可靠性越高,所需的样本容量越大;
反之,估计的可靠性越低,所需的样本容量越小。
(4)抽样方式。
在其他条件相同的情况下,采用重置抽样方式比采用不重置抽样方式所需的样本容。
3、如果总体方差未知,在确定样本容量时,应如何?
在实践中,估计样本量时若
未知,可根据以下方法来确定
:
第一,根据历史资料已有的方差代替;
第二,在正式抽样调查之前,开展一次试验性调查,根据试验性调查所得资料加以估计;
第三,如果有多次实验结果或多个历史方差,则根据最大的方差来代替总体方差计算样本量。
4、
s2=1.457
5、解:
=2.12S=
=0.2239
=
t
因此总体均值95%的置信区间为(
1.96,2.28)
6、某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
s=4.5
=z
=
总体均值95%的置信区间为(34.146,35.854)
7、
(1)
测试成绩(分)
60以下
60~70
70~80
80~90
90以上
X
55
65
75
85
95
学生数(人)F
22
40
8
XF
550
1300
1650
3400
760
7660
S=11.3772
=
z
=76.6
该校学生英语测试的平均成绩的置信区间为(73.32,78.87)
大样本情形下总体比例
的置信区间为:
)
平均成绩在80分以上的学生所占的比重为(0.38,0.58)
2.均值比较的T检验分几种类型?
独立样本均值的T检验和配对样本均值的T检验
3.解:
H0:
,H1:
样本比例
检验统计量
接受原假设认为50%的消费者是中学生
4.略
5.
从两种工艺条件下生产的产品中各抽取100个样本属于独立样本。
H0:
1=
2,H1:
1≠
,接受原假设,两种工艺条件下生产产品的强力无显著差异。
6.解
已知:
小样本,正态分布,方差相等,
1=20.1
2=19.8
12=0.17
22=0.14。
,,
=0.4282
对于给定的显著性水平
=0.05,查
分布表可得
0.025(12)=2.1788,由于|
|=1.2973<
2.1788=
0.025(12),所以应接受原假设。
认为甲、乙两台机器加工的产品平均直径无显著差异。
7.某企业生产三种不同口味的点心,为了分析不同性别的消费者的口味偏好,随机抽取了110名消费者进行调查,在品尝三种不同口味的点心后陈述其偏好,结果如下表所示:
偏好
水果味
巧克力味
肉味
性别
男
35
女
25
45
30
在显著性水平0.05下,检验性别是对口味的偏好是否有显著差异?
根据公式
可计算得在原假设成立的条件下的期望分布表如下:
23.6
17.7
16.4
12.3
当显著性水平为0.05时,
,检验结果表明性别与口味相关,性别是对口味的偏好是有显著影响。
第六章
1.方差分析的基本原理是什么?
总偏差平方和可分解为组间方差与组内方差。
组间方差即水平间的方差,该方差既有由于水平均值不同而引起的系统性误差,又有随机误差存在。
如果H0成立,水平间的方差就只包含随机误差,没有由于均值的不同而导致的系统性差异,此时,组间方差与组内方差均是随机误差,他们的取值就应该接近,比值应该接近于1;
相反若H0不成立,水平间的方差既包含随机误差,又有系统性误差,组间方差大于组内方差,二者的比值也显著的大于1,当大到超过某一临界值时,就可认为水平均值之间存在差异。
2.说明单因素方差分析中SST、SSE、SSA的含义及三者之间的关系。
SST总离差平方和,是全部试验的每一观察值Xij对其总平均数
的离差平方总和。
SST=
,为各行观察值对各该行平均数(组平均数)的离差平方和的总和,反映的是水平内部,或组内观察值的离散状况,称其为组内平方和或组内方差,反映了由于随机误差的作用而在数据Xij中引起的波动。
为组平均数对总平均数的离差平方和,反映的是组间差异,其中既包括随机因素,也包括系统因素,称其为组间平方和或水平项离差平方和。
3,4,5,6题可进行软件操作,略
第七章
1.什么是相关关系?
当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定范围内变化,变量间的这种具有不确定性的相互关系,称为相关关系。
2.相关分析与回归分析有何联系与区别?
相关分析与回归分析有着密切的联系。
相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度,只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。
可以这样说,相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。
区别:
(1)相关分析中,变量x变量y处于平等的地位;
回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化
(2)相关分析中所涉及的变量x和y都是随机变量;
回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量
(3)相关分析主要是描述两个变量之间线性关系的密切程度;
回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
3.什么是总体回归函数?
什么是样本回归函数?
它们之间有什么联系和区别?
若用Y表示因变量,其主要受自变量X的影响,则Y和X之间的总体回归函数可表示为:
为未知参数,也叫回归系数,
为随机误差项。
在实际应用中,由于无法取得Y和X的全部数值,一般需要用样本资料来估计两变量数量关系,根据样本资料拟合的回归模型称为样本回归模型,一元线性样本回归模型可表示为:
分别是总体回归系数
的估计值,
为参差,是随机误差
的估计值,是实际值与估计值之间的差额。
4.如何识别多重共线性