人民大学同等学历人员申请硕士学位考试试题题库统计设计研究.docx
《人民大学同等学历人员申请硕士学位考试试题题库统计设计研究.docx》由会员分享,可在线阅读,更多相关《人民大学同等学历人员申请硕士学位考试试题题库统计设计研究.docx(30页珍藏版)》请在冰豆网上搜索。
人民大学同等学历人员申请硕士学位考试试题题库统计设计研究
中国人民大学接受同等学历人员申请硕士学位考试试题
(1)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)随机抽取20块手机电池,测得其使用寿命数据如下(单位:
小时):
1008
993
998
1007
1011
1002
1013
999
1008
995
983
995
1000
977
1015
1010
998
1005
1011
996
列出描述上述数据所适用的统计图形,并说明这些图形的用途。
二、(20分)方差分析中有哪些基本假定?
这些假定中对哪个假定的要求比较严格?
三、(20分)某种食品每袋的标准重量是100克,从该批食品中抽取一个随机样本,检验假设
,
。
(1)如果拒绝
,你的结论是什么?
,如果不拒绝
,你的结论是什么?
(2)能否得到一个样本能够证明该食品的平均重量是100克?
请说明理由。
(3)如果由该样本得到的检验的
,你的结论是什么?
0.03这个值是犯第Ⅰ类错误的概率,是实际算出来的显著性水平,你怎样解释这个
值?
四、(20分)在建立多元线性回归模型时,通常需要对自变量进行筛选。
(1)请谈谈你对变量筛选的必要性的看法。
(2)列出变量筛选的方法,请简要说明这些方法的特点。
五、(20分)如果一个时间序列包含趋势、季节成分、随机波动,适用的预测方法有哪些?
对这些方做检验说明。
中国人民大学接受同等学历人员申请硕士学位考试试题
(2)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)在某小学随机抽取35名小学生,调查他们每周购买零食的花费情况,得到的数据如下(单位:
元):
24
17
26
29
38
6
28
44
39
8
30
17
26
32
40
10
20
27
43
33
15
4
28
35
26
47
25
17
26
45
16
36
29
37
15
列出描述上述数据所适用的统计量,并说明这些统计量的用途。
二、(20分)简要说明
分布和
分布在推断统计中应用。
三、(20分)什么是
值?
要证明原假设不正确,如何确定合理的
值?
四、(20分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。
通过对每个工人生产的产品数进行方差分析得到下面的结果:
方差分析表
差异源
SS
df
MS
F
P-value
组间
210
0.245946
组内
3836
—
—
总计
29
—
—
—
(1)完成上面的方差分析表。
(2)组装方法与组装产品数量之间的关系强度如何?
(3)若显著性水平
,检验三种方法组装的产品数量之间是否有显著差异?
五、(20分)简要说明分解预测的基本步骤。
中国人民大学接受同等学历人员申请硕士学位考试试题(3)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:
要对各名运动员进行综合评价,使用的统计量有哪些?
简要说明这些统计量的用途。
二、(20分)为什么说假设检验不能证明原假设正确?
三、(20分)为估计公共汽车从起点到终点平均行驶的时间,一家公交公司随机抽取36班公共汽车,得到平均行驶的时间为26分钟,标准差为8分钟。
(1)说明样本均值服从什么分布?
依据是什么?
(2)计算平均行驶时间95%的置信区间。
(3)解释95%的置信水平的含义。
(
,
,
,
)
四、(20分)设单因素方差分析的数学模型为:
。
解释这一模型的含义,并说明对这一模型的基本假定。
五、(20分)在多元回归中,判断共线性的统计量有哪些?
简要解释这些统计量。
中国人民大学接受同等学历人员申请硕士学位考试试题(4)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)在2008年8月10日举行的第29届北京奥运会男子10米气手枪决赛中,最后获得金牌和银牌的两名运动员10枪的决赛成绩如下表所示:
运动员
决赛成绩
庞伟
9.3
10.3
10.5
10.3
10.4
10.3
10.7
10.4
10.7
9.3
秦钟午
9.5
9.9
10.6
10.3
9.4
10.2
10.1
10.8
9.9
9.8
根据上表计算的韩国运动员秦钟午的平均环数是10.05环,标准差是0.445环。
比较分析哪个运动员的发挥更稳定。
二、(20分)什么是统计意义上的显著性?
为什么说统计上显著不一定就有现实意义?
三、(20分)简要说明判断一组数据是否服从正态分布的统计方法。
四、(20分)国家统计局目前对地区的划分中,将我国31个省市自治区划分为东部地区、中部地区、西部地区、东北地区。
(1)要分析四个地区的平均消费水平是否存在显著差异,所用的统计方法有哪些?
这些方法的区别是什么?
(2)你会选择什么方法进行分析?
你的假设是什么?
五、(20分)一家房地产评估公司想对某城市的房地产销售价格
(元/m2)与地产的评估价值
(万元)、房产的评估价值
(万元)和使用面积
(m2)建立一个模型,以便对销售价格作出合理预测。
为此,收集了20栋住宅的房地产评估数据,由统计软件给出的部分回归结果如下(显著性水平为95%):
方差分析
df
SS
MS
F
Sig.
回归
3
87803505.46
29267835.15
46.70
3.879E-08
残差
16
10028174.54
626760.91
总计
19
97831680
Coefficients
标准误差
tStat
P-value
Intercept
148.7005
574.4213
0.2589
0.799
XVariable1
0.8147
0.512
1.5913
0.1311
XVariable2
0.821
0.2112
3.8876
0.0013
XVariable3
0.135
0.0659
2.0503
0.0571
对所建立的回归模型进行综合评价。
中国人民大学接受同等学历人员申请硕士学位考试试题(5)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)为研究大学生的逃课情况。
随机抽取350名大学生进行调查,得到的男女学生逃课情况的汇总表如下。
是否逃课
男
女
合计
逃过课
84
88
172
未逃过课
78
100
178
合计
162
188
350
(1)这里涉及的变量有哪些?
这些变量属于什么类型?
(2)描述上述数据所适用的统计图形有哪些?
二、(20分)现从一批零件中随机抽取16只,测得其长度(单位:
厘米)如下:
15.1
14.5
14.8
14.6
15.2
14.8
14.9
14.6
14.8
15.1
15.3
14.7
15.0
15.2
15.1
14.7
(1)如果要使用
分布构建零件平均长度的置信区间,基本的假定条件是什么?
(2)构建该批零件平均长度的95%的置信区间。
(3)能否确定该批零件的实际平均长度就在你所构建的区间内?
为什么?
(注:
)
三、(20分)在假设检验中,当不拒绝原假设时,为什么一般不采取“接受原假设”的表示方式?
四、(20分)简要说明
分布在统计中的应用。
五、(20分)简要说明解决多元回归中共线性的方法。
中国人民大学接受同等学历人员申请硕士学位考试试题(6)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男女观众进行了调查,得到喜欢该档娱乐节目的观众比例(单位:
%)如下:
年龄段
男性
女性
20岁以下
5
6
20—30岁
25
32
30—40岁
16
15
40—50岁
12
12
50岁以上
6
8
(1)这里涉及的变量有哪些?
这些变量属于什么类型?
(2)描述上述数据所适用的统计图形有哪些?
二、(20分)假定总体共有1000个个体,均值
,标准差
。
从中抽取容量为100的所有简单随机样本。
样本均值
的期望值和标准差各是多少?
得出上述结论所依据的是统计中的哪一个定理?
请简要叙述这一定理。
三、(20分)在假设检验中,利用
决策与利用统计量决策有什么不同?
四、(20分)简要说明方差分析的基本原理。
五、(20分)比较说明指数曲线和直线的异同。
中国人民大学接受同等学历人员申请硕士学位考试试题(7)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。
请回答下面的问题
(1)是男生的体重差异大还是女生的体重差异大?
为什么?
(2)粗略地估计一下,男生中有百分之几的人体重在55kg到65kg之间?
(3)粗略地估计一下,女生中有百分之几的人体重在40kg到60kg之间?
二、(20分)叙述评价估计量的标准。
三、(20分)一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买,两家供货商生产的灯泡使用寿命的方差大小基本相同,价格也很相近,房地产公司购进灯泡时考虑的主要因素就是使用寿命。
其中一家供货商声称其生产的灯泡平均使用寿命在1500小时以上。
如果在1500小时以上,在房地产公司就考虑购买。
由36只灯泡组成的随机样本表明,平均使用寿命为1510小时,标准差为193小时。
(1)如果是房地产开发公司进行检验,会提出怎样的假设?
请说明理由。
(2)如果是灯泡供应商进行检验,会提出怎样的假设,请说明理由。
四、(20分)什么是判定系数?
它在回归分析中的主要作用是什么?
五、(20分)说明
分布的适用条件,如何判断某个过程产生的数据满足这一条件?
中国人民大学接受同等学历人员申请硕士学位考试试题(8)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。
预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。
下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。
在股票市场上,高收益率往往伴随着高风险。
但投资于哪类股票,往往与投资者的类型有一定关系。
(1)你认为该用什么样的统计量来反映投资的风险?
(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?
(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?
二、(20分)某种感冒冲剂规定每包重量为12克,超重或过轻都是严重问题。
从过去的生产数据得知
克,质检员抽取25包冲剂称重检验,平均每包的重量为11.85克。
假定产品重量服从正态分布。
(1)根据上述检验计算出的
,感冒冲剂的每包重量是否符合标准要求(
)?
(2)说明上述检验中可能犯哪类错误?
该错误的实际含义是什么?
三、(20分)简述方差分析的基本假定。
四、(20分)怎样自相关图和偏自相关图来识别ARIMA(
)模型中的参数?
五、(20分)什么是回归中的置信区间估计和预测区间估计?
两个区间的宽度是否一样?
取何值时两个区间宽度最窄?
中国人民大学接受同等学历人员申请硕士学位考试试题(9)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。
请回答下面的问题,并解释其原因。
(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?
或者这两组样本的平均身高相同?
(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?
或者这两组样本的标准差相同?
(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?
或者对两位调查研究人员来说,这种机会是相同的?
二、(20分)在参数统计分析中,应用
分布、
分布和
分布的假定条件是什么?
如何判断样本数据是否满足假定条件。
三、(20分)由于时间和成本对产量变动的影响很大,所以在一种新的生产方式投入使用之前,生产厂家必须确信其所推荐新的生产方法能降低成本。
目前生产中所用的生产方法成本均值为每小时200元。
对某种新的生产方法,测量其一段样本生产期的成本。
(1)在该项研究中,建立适当的原假设和备择假设。
(2)当不能拒绝
时,试对所做的结论进行评述。
(3)当可以拒绝
时,试对所做的结论进行评述。
四、(20分)列出度量下述测度变量间的关系所使用的统计量。
(1)两个分类变量。
(2)两个数值变量。
(3)两个顺序变量。
(4)一个分类变量与一个数值变量。
五、(20分)在多元线性回归分析中,
检验和
检验有何不同?
中国人民大学接受同等学历人员申请硕士学位考试试题(10)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)在2008年8月北京举办的第29届奥林匹克运动会上,获得金牌总数前三名的国家及奖牌数如下。
要描述这一数据,可以使用的图形有哪些?
说明它们在描述这一数据中的用途。
排名
国家
金
银
铜
总
1
中国
51
21
28
100
2
美国
36
38
36
110
3
俄罗斯
23
21
28
72
列出适合展示上述数据的图形并说明这些图形的用途。
二、(20分)某企业生产的产品需用纸箱进行包装,按规定供应商提供的纸箱用纸的厚度不应低于5毫米。
已知用纸的厚度服从正态分布,
一直稳定在0.5毫米。
企业从某供应商提供的纸箱中随机抽查了100个样品,得样本平均厚度
毫米。
(1)在
的显著显著性水平上,是否可以接受该批纸箱?
该检验中会犯哪类错误?
该错误的含义是什么?
(2)抽查的100个样本的平均厚度为多少时可以接收这批纸箱?
此时可能会犯哪类?
该错误的含义是什么?
(注:
,
)
三、(20分)简要说明
分布在统计中的的应用。
四、(20分)在多元线性回归分析中,如果某个回归系数的
检验不显著,是否就意味着这个自变量与因变量之间的线性回归不显著?
为什么?
当出现这种情况时应如何处理?
五、(20分)下表是某贸易公司近几年的出口额数据:
年份
出口额(万美元)
2002
13
2003
19
2004
24
2005
35
2006
58
2007
88
2008
145
(1)从图形上判断,出口额时间序列含有什么成分?
(2)要预测该公司的出口额,应采用哪种趋势线?
该趋势线的特点是什么?
(3)根据上面的数据拟合的指数曲线方程为:
,这里的0.4909的具体含义是什么?
中国人民大学接受同等学历人员申请硕士学位考试试题(11)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)A、B两个班各有50名学生,统计学考试成绩的描述统计量如下:
统计量
A班
B班
平均数
74.4
68.5
中位数
75
67
25%四分位数
67
56
75%四分位数
80
83
标准差
10.6
17.4
最小值
44
35
最大值
96
100
(1)画出两个班考试成绩的箱线图,并比较分布的特征。
(2)根据统计量对两个班考试成绩的特点进行分析。
(3)两个班考试成绩的最低分和最高分是否属于离群点?
二、(20分)谈谈你对方差分析的理解。
三、(20分)某厂产品的优质品率一直保持在40%,近期质检部门来厂抽查,共抽查了50件产品,其中优质品为9件。
(1)在
的显著显著性水平上,能否认为其优质品率仍保持在40%?
(2)该检验中可能犯哪类错误?
其含义是什么?
(3)根据上述检验计算出的
,解释这个
值的具体含义。
(注:
,
)
四、(20分)设因变量为
,
个自变量分别为
,则多元线性回归模型可表示为:
。
(1)对这一模型的假设有哪些?
(2)如果模型中存在多重共线性,会对结果产生哪些影响?
(3)解决多重共线性的方法有哪些?
对各方法进行简要评述。
五、(20分)使用主成分分析和因子分析时应注意哪些问题?
中国人民大学接受同等学历人员申请硕士学位考试试题(12)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)下表是2006年北京、上海和天津按收入法计算的地区生产总值(按当年价格计算)数据。
地区
劳动者报酬
生产税净额
固定资产折旧
营业盈余
北京
3496.57
1161.55
1251.09
1961.07
天津
1383.36
775.09
595.09
1605.61
上海
3756.56
1623.36
1730.51
3255.94
描述上述数据的图形有哪些?
简要说明这些图形的用途。
二、(20分)一家超市某种牛奶的日销售量服从正态分布,
未知。
根据已往经验,其销售量均值为60箱。
该超市在最近一周进行了一次促销活动,以促进销售。
一周的日销量数据(单位:
箱)分别为:
64,57,49,73,76,70,59。
a)检验促销活动是否有效(
)。
b)该检验中可能犯哪类错误?
其含义是什么?
c)根据上述检验计算出的
,解释这个
值的具体含义。
(注:
,
)
三、(20分)一家电视台为了解观众对某档娱乐节目的喜欢程度,对不同年龄段的男女观众进行了调查,得到喜欢该档娱乐节目的观众比例(单位:
%)如下:
年龄段
男性
女性
20岁以下
6
8
20—30岁
25
32
30—40岁
16
15
40—50岁
12
12
50岁以上
5
6
要分析男性观众喜欢该档娱乐节目的比例和女性是否一致,使用的统计方法是什么?
简要说明分析的基本步骤。
四、(20分)在因子分析中,因子数量的确定通常需要考虑哪些因素?
五、(20分)在多元线性回归中,选择自变量的方法有哪些?
中国人民大学接受同等学历人员申请硕士学位考试试题(13)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)下面是测量的30袋食品重量的绝对误差数据(单位:
克):
6.1
4.7
6.5
6.2
7.7
6.4
5.5
7.1
6.1
5.3
5.7
6.1
5.3
4.0
4.8
3.2
3.9
1.9
4.9
3.8
5.3
2.6
5.3
5.5
5.8
2.7
6.8
7.4
5.6
3.3
(1)适合描述该组数据分布的图形有哪些?
说明这些图形的主要特点。
(2)适合描述该组数据分布特征的统计量主要有哪些?
说明这些统计量的特点。
二、(20分)从3个总体中各抽取容量不同的样本数据,检验3个总体的均值之间是否有显著差异,得到的方差分析表如下(
):
差异源
SS
df
MS
F
P-value
组间
A
2
388
C
0.011
组内
450
9
B
总计
1226
11
(1)计算出表中A、B、C三个单元格的数值。
(2)A、B两个单元格中的数值被称为什么?
它们所反映的信息是什么?
(3)在0.05的显著性水平下,检验的结论是什么?
三、(20分)谈谈那个置信水平和置信区间的理解。
四、(20分)要建立一个多元线性回归模型,谈谈你的建模思路。
五、(20分)聚类分析时对变量或数据有哪些基本要求?
中国人民大学接受同等学历人员申请硕士学位考试试题(14)
招生专业:
统计学
考试科目:
统计研究
课程代码:
考题卷号:
一、(20分)为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400个消费者作了抽样调查,得到如下结果:
汽车价格
东部地区
中部地区
西部地区
10万元以下
20
40
40
10—20万元
50
60
50
20—30万元
30
20
20
30万元以上
40
20
10
列出描述上述数据所适用的统计图形,并说明这些图形的用途。
二、(20分)从一批零件中随机抽取16只,测得其评价长度为14.9cm,标准差为0.25cm。
(1)如果要使用
分布构建零件平均长度的置信区间,基本的假定条件是什么?
(2)构建该批零件平均长度的95%的置信区间。
(3)能否确定该批零件的实际平均长度就在你所构建的区间内?
为什么?
(注:
)
三、(20分)某汽车制造公司想了解广告费用(
)对销售量(
)的影响,收集了过去10年有关广告费用(单位:
万元)和销售量(单位:
辆)的数据,希望建立二者之间的线性回归方程,并通过广告费用来预测汽车的销售量。
通过计算得到下面的部分结果:
回归平方和(SSR)
755456
残差平方和(SSE)
37504
回归方程的截距
348.94
回归方程的斜率
14.41
(1)写出销售量与广告费用的直线回归方程,并解释回归系数的实际意义。
(2)计算判定系数
,说明汽车销售量的变差中有多少是由于广告费用的变动引起的?
(3)计算估计标准误差
,并解释其实际意义。
四、(20分)简述分解法预测的基本步骤。
五、(20分)对于聚类分析回答下面的问题:
(1)解释Q型聚类和R型聚类的含义。
(2)聚类分析与判别分析有何不同?
中国人民大学接受同等学历人员申请硕士学位考试试题(15)
招生专业:
统计学
考试